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PREFACIO 


De la misma manera que en las ediciones anteriores de este libro, esta tercera edition continua enfatizando 
la importancia de aplicar el analisis estadistico a la solucion de problemas comunes en los negocios. 
Toda oportunidad se utiliza para demostrar la forma como la estadistica puede, de manera efectiva 
facilitar muchas decisiones que los gerentes enfrentan casi a diario. Ademas, la obra se ha condensado 
para presentar el material de forma mas concisa y manejable. Varias de las caracteristicas pedagogicas 
descritas a continuacion tambien han sido agregadas para mejorar las ventajas de instruction expuestas 
en este texto. 

Esta tercera edition de Estadistica aplicada a los negocios y la economia, se puede utilizar de 
manera efectiva en un curso de estadistica. A pesar de que el material ha sido comprimido para 
permitir una discusion tipica y dinamica de un curso de un semestre, la cobertura de temas sigue siendo 
suficiente para retar incluso al lector que termino su exposition inicial al analisis estadistico en una 
secuencia de dos semestres. 

A continuacion se presenta una breve description de las caracteristicas pedagogicas contenidas en 
esta edition. 


Aspectos que se mantuvieron de la edicion anterior 

• Organization del capitulo 

Cada capitulo abre con un diagrama de flujos que muestra los principales temas a tratar y la forma 
como se relacionan entre si. Esto permite que el lector tenga la oportunidad de organizar el proceso que 
puede utilizar para dominar el material en dicho capitulo. 

• Ejemplos con tres partes 

Cada ejemplo de las herramientas estadisticas disponibles para las personas que toman las decisiones 
en los negocios, presenta una situation real que requiere una solucion y son las situaciones tipicas que 
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se enfrentan al gerenciar una empresa. Estos ejemplos constan de tres partes. La primera es el 
planteamiento del problema que describe el dilema que debe resolverse. La segunda parte suministra 
una solution completa y coherente a dicho problema. Quiza lo mas importante para el lector, pero que 
se encuentra ausente en muchos otros textos de estadfstica, es la interpretation de dicha solucion. No 
es bueno para el lector resolver un problema cuya solucion no comprende. 


* Un procedimiento para la elaboration de reportes 

La comunicacion en los negocios es fundamental. Para que un negocio funcione como una unidad, los 
individuos que estan dentro de dicho negocio deben poder comunicar sus ideas y pensamientos. El 
apendice I describe e ilustra la forma como se debe preparar un informe para comunicar los propositos 
esenciales y las recomendaciones a otros que esten interesados en los resultados. Sin esta importante 
destreza, quienes toman decisiones estan en gran desventaja en su intento por dirigir un negocio. 

• Problemas resueltos 

Cada capftulo concluye con problemas y soluciones elaboradas que refuerzan las herramientas estadfsticas 
que se presentaron en dicho capftulo. Esta caracterfstica proporciona un resumen conveniente y util de 
las herramientas cruciales que se espera que el lector domine. 


• Lista de formulas 

Al final de cada capftulo se proporciona una lista manual de todas las formulas presentadas a traves del 
capftulo y una breve description de su uso. 


• Aplicaciones por computador 

Se proporcionan instrucciones para mostrar como pueden utilizarse las herramientas estadfsticas en un 
computador. Se presentan las impresiones de pantallas de computador con enfasis en Minitab y Excel 
junto con la discusion de sus aspectos importantes. 


• Ejercicios por computador 

El texto viene con un disquete que contiene varios archivos de datos a los que se puede tener acceso en 
los formatos de Minitab, Excel y ASCII. Algunos capftulos proporcionan al lector un problema que 
debe resolver con base en los datos que aparecen en dichos archivos y con la ayuda de las herramientas 
estadfsticas discutidas en el capftulo. Lo anterior offece al lector una situation real que requiere de la 
aplicacion de las tecnicas estadfsticas en el conjunto de datos que hay en el computador. 


• Problemas del capitulo 

Al final de cada capftulo existe una amplia gama de problemas con una diversidad de grados de dificultad 
que brindan al lector la oportunidad de agudizar y refinar sus habilidades estadfsticas. De nuevo, estos 
problemas son de naturaleza aplicada lo que demuestra claramente como la estadfstica puede ayudar al 
proceso de toma de decisiones en los negocios. 
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Nuevas caracteri'sticas de la tercera edicion 

• Ejercicios de la section 

Despues de cada section, dentro de cada capftulo se encuentran varios ejercicios que el lector debe 
resolver y que refuerzan su comprension del material expuesto. Esto proporciona una retroalimentacion 
inmediata sobre si se ha comprendido en forma suficiente el material de dicha section antes de proceder 
a la siguiente. 

• Escenario 

Cada capftulo inicia con un recuento corto denominado Escenario que presenta un caso real que se 
puede tratar mejor utilizando las herramientas estadfsticas contenidas en dicho capftulo. Se describe la 
naturaleza del problema que se debe resolver y asf se proporciona al lector los fundamentos sobre los 
cuales debe realizar sus lecturas y el analisis del material del capftulo. 

• Puesta en escena 

Es una corta section al cierre de cada capftulo que remite al lector a la section initial Escenario. Se 
proporcionan datos e information adicional para resolver la situation propuesta en la section Escenario, 
utilizando el conocimiento adquirido en el capftulo. Este ejercicio combina todo el capftulo en un solo 
“paquete” que mejora la comprension total sobre el material y ata de manera efectiva los cabos sueltos. 

• Del escenario a la vida real 

El segmento final de cada capftulo proporciona sitios Web en internet que el lector puede consultar para 
encontrar datos e information complementaria, y la cual pueda utilizar para su estudio estadfstico 
adicional. Estos sitios Web se seleccionan especialmente pararelacionarlos con los asuntos y problemas 
planteados en las secciones Escenario y Puesta en escena. 


Allen L. Webster 




de la estadfstica 












Plan del capitulo 


Este capitulo introduce al concepto de estadfstica como un estudio organizado. Se presenta el proposito general 
del analisis estadfstico y las muchas formas en las cuales la estadfstica puede ayudar a encontrar soluciones a 
problemas que se presentan en la vida profesionaL 


El papel de la estadfstica 
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E S C E N A R I 0 


La re vista Fortune (diciembre 9, 1996) informa que un 
frenesf en la contratacidn ha hecho que se produzca un 
“mercado laboral de vendedores para nerds”. La busqueda 
del talento en el sector de la informacidn en tecnologia ha 
generado una competencia tan intensa para “aficionados a 
la cudntica y a los computadores” que quienes buscan 
trabajo, con incluso mfnimas habilidades cuantitativas, estin 
llenos de ofertas. El talento es tan escaso y la demanda tan 
elevada que las compamas estin contratando a estudiantes 
de bachillerato y otras compamas est&n tratando de 
arrebatdrselos. 

Pete Davis, un ingeniero senior de sistemas y redes para 
la T1AC, proveedor de servicios de internet en Bedford, 
Massachusetts, ha recibido por lo menos 15 ofertas de 
trabajo desde que desempefia su cargo actual -lo cual no 
esta nada mal para alguien que tan sdlo tiene 18 anos- 
Quienes estin encargados de la contrataci6n de personal 
llaman a Davis o le envfan por correo electrdnico opciones 
atractivas y ofertas de pago con incrementos lucrativos. 
Aunque el cargo de Davis no es del todo tfpico, la batalla es 
para los empleados que estan capacitados en analisis de 
datos. 

La estrategia parece valer la pena para negocios que 
buscan, de manera agresiva, talento joven que sea capaz de 
analizar y comprender la informaci6n cuantitativa. Como 


lo demuestra el siguiente diagrama, las utilidades de estas 
compaiifas han respondido de manera favorable, incre- 
mentandose mucho mas rapidamente que las utilidades de 
otras compaiifas que le estan dando largas a su ingreso a la 
era de la informacidn. El Informe sobre la Industria 
Educativa (Education Industry Report) de St. Cloud, 
Minnesota, presentd un fndice de utilidades de 15 
compaiifas que est£n buscando, de manera agresiva, 
empleados que puedan manejar datos y aplicar el 
pensamiento analftico y estadfstico Msico a problemas 
empresariales comunes. Se compar6 el fndice de Evaluacidn 
de Alerta en el Manejo de Datos (Data Management Alert 
Assessment , DMAA) con el indice de la Asociacidn 
Nacional de Cotizaciones Automatizadas de Agentes de 
Bolsa (National Association of Security Dealers Automated 
Quotations , NASDAQ). Los resultados son evidentes. 
Los rendimientos de las empresas que contratan gente que 
posee conocimientos bdsicos en estadistica sobrepasan 
los de empresas que aun no han visto tal luz. El 
reconocimiento, por parte de un numero creciente de 
negocios, de la necesidad que tienen los gerentes efectivos 
de tener por lo menos conocimientos rudimentarios de 
estadistica ha precipitado -segun los terminos de la revista 
Fortune -, una carrera por el talento, que se asemeja al 
frenesf agrario de la 6poca en la que se persegufa la 
apropiacion gratuita de la tierra en Oklahoma. 


Porcentaje de incremento en las utilidades 
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1.1 Introduccion 

A medida que aumenta la complejidad de nuestro mundo, se hace cada vez mas diffcil tomar decisiones inteligentes 
y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento 
adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales 
para nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos recibiendo presiones 
debido a problemas economicos angustiosos como una inflation galopante, el sistema tributario engorroso y 
oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido economico y social esta amenazado por la 
contamination ambiental, la deuda publica onerosa, la tasa de criminalidad que siempre va en aumento y las 
impredecibles tasas de interes. 

Si estas condiciones parecen ser caracterfsticas del estilo de vida actual, no debe olvidarse que problemas de 
esta naturaleza contribuyeron a la cafda de la antigua Roma mas que la invasion de las hordas de barbaros 
provenientes del norte. Un perfodo de exito en este planeta, relativamente corto, no es garantfa de una supervivencia 
futura. A menos que puedan encontrarse soluciones viables a estos apremiantes problemas, podnamos acompanar 
en el olvido al dinosaurio y al ave dodo, como ya lo hicieron los antiguos romanos. 

Este capitulo aportara una vision general sobre lo que es la estadfstica y como puede utilizarse. Esta vision 
general sobre la naturaleza de la estadfstica y los beneficios que puede proporcionamos se efectuara revisando: 

• Las definiciones basicas de las herramientas estadfsticas. 

• Como llevar a cabo el muestreo para realizar analisis estadfsticos. 

• Las funciones que cumple la estadfstica. 

• Como puede ayudar la estadfstica en la profesion. 

Comencemos con una breve exposition del papel significativo que juega la estadfstica en el delicado proceso de 
toma de decisiones. 


1.2 La importancia de la estadfstica 

Virtualmente cada area de la investigacion cientffica seria puede beneficiarse del analisis estadfstico. Para quien 
formula las polfticas economicas y para quien asesora al presidente y a otros funcionarios publicos sobre 
procedimientos economicos apropiados, la estadfstica ha demostrado ser una herramienta valiosa. Las decisiones 
sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse 
de manera inteligente tan solo con la ayuda del analisis estadfstico. Los hombres y mujeres de negocios, en su 
etema busqueda de la rentabilidad, consideran que la estadfstica es esencial en el proceso de toma de decisiones. 
Los esfuerzos en control de calidad, minimization de costos, combination de productos e inventarios, y una gran 
cantidad de otros asuntos empresariales, pueden manejarse efectivamente a traves del uso de procedimientos 
estadfsticos comprobados. 

Para quienes estan en el area de la investigacion de mercados, la estadfstica es de gran ayuda en el momento 
de determinar que tan probable es que un producto nuevo sea exitoso. La estadfstica tambien es muy util para 
evaluar las oportunidades de inversion por parte de asesores financieros. Los contadores, los jefes de personal, 
y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del analisis estadfstico. Incluso 
un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento, considera la 
estadfstica una aliada imprescindible. 

Tales aplicaciones y muchas otras se ilustran a lo largo de este texto. Se mostrara como utilizar la estadfstica 
en el mejoramiento del desempeno laboral y en muchos otros aspectos de la vida diaria. 
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1.3 Oportunidades que ofrece la estadi'stica 

Es factible que en pocos anos abandone la relativa seguridad del ambiente academico y este metido de cabeza en 
el mundo competitive). Desde el punto de vista practico, usted debe conocer la manera de utilizar los conocimientos 
en estadistica despues de graduarse. No existe duda alguna acerca de que una experiencia academica, 
adecuadamente relacionada con unos firmes cimientos ampliara significativamente las oportunidades de encontrar 
empleo y, posteriormente, le permitira demostrar la competitividad laboral. 

Cuando encuentre ese trabajo anhelado que le ponga en la rapida ruta del exito profesional, su jefe espera que 
usted haga dos cosas: 

1. Tomar decisiones. 

2. Solucionar problemas. 

Estos dos cometidos pueden lograrse a traves de la aplicacion de procedimientos estadfsticos. 


A. La aplicacion universal de la estadi'stica 

A1 ser capaz de solucionar problemas y tomar decisiones, se obtendra una excelente position en la demanda del 
mercado laboral. Si logra tomar decisiones incisivas cuando se esta solucionando los problemas de alguien, dicha 
persona estara dispuesta a proporcionarle una recompensa generosa. El mundo laboral paga mas a las personas 
que son capaces de plantear las preguntas correctas para alcanzar los objetivos fundamentals, que a quienes 
tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante evidentes una vez que se 
han planteado las preguntas. El analisis estadistico probara ser de gran utilidad en la acertada formulation de 
estas preguntas esenciales. 

Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual requieren soluciones 
cuantitativas. Si usted no esta en capacidad de aplicar la estadistica y otros metodos cuantitativos a muchos de 
los problemas comunes que sin duda se le presentaran, estara en gran desventaja en el mercado laboral. 

Casi todas las areas del saber requieren del pensamiento estadistico. Las disciplinas de estudio que dependen 
ampliamente del analisis estadistico, incluyen -pero no se limitan a-, marketing , finanzas, economia e investigation 
de operaciones. Los principios aprendidos en contabilidad y gerencia administrativa tambien se basan en la 
preparation estadistica. 

Los analistas financieros y economicos con frecuencia se basan en sus habilidades cuantitativas para 
proporcionar soluciones a problemas diffeiles. La comprension de los principios financieros y economicos permitira 
aplicar las tecnicas estadisticas para hallar soluciones viables y tomar decisiones. Quienes aspiran a cargos en el 
area contable o administrativa, a ser independientes, o a desempenar otra profesion en el sector industrial, 
descubriran que comprender la estadistica no solo mejora las oportunidades de obtener un empleo, sino que 
tambien aumenta la probabilidad de promotion mediante el enriquecimiento en el desempeno laboral. 

Las personas empleadas en tareas cuantitativas que trabajan con procedimientos estadfsticos, con frecuencia 
gozan de salarios mas altos y estan mas protegidos de los trabajos sin futuro. Ademas, muy al inicio de sus 
carreras, generalmente se encuentran en contacto cercano con personas en cargos de alto nivel. La proximidad a 
la elite ejecutiva es inevitable porque la alta gerencia necesita de la information y asistencia que la gente con 
entrenamiento en estadistica puede proporcionarle. En el mercado laboral actual, los empresarios sencillamente 
no desean contratar o conservar a quienes no saben estadistica. 

Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio publico, el gobiemo, 
o hacia alguna otr^ fuente de retribution remunerada, la experiencia academica sera mas completa si se adquiere 
una solida formacion en fundamentos de analisis estadistico. 
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B. Gerencia de calidad total 


A medida que la competencia mundial se intensifies surge, de parte de los negocios, un esfuerzo por promover la 
calidad de sus productos. Este esfuerzo, conocido ampliamente como Gerencia de Calidad Total ( Total Quality 
Management, TQM), tiene como proposito central la promotion de las cualidades del producto que el consumidor 
considera importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y la respuesta 
rapida a las posibles quejas del consumidor. Hoy dfa, la mayoria de los grandes negocios (asf como tambien 
muchos negocios pequenos) tienen departamentos de Control de Calidad ( Quality Control, QC) cuya funcion 
es recolectar datos sobre el desempeno y solucionar problemas de calidad. Asf, la TQM representa un area 
creciente de oportunidades para quienes tienen conocimientos en estadfstiea. 

La TQM involucra el uso de equipos administrativos integrados conformados por ingenieros, expertos en 
marketing, especialistas en diseno, estadfsticos, y otros profesionales que pueden contribuir a la satisfaction del 
cliente. La formation de estos equipos, denominada Despliegue de la Funcion de Calidad ( Quality Function 
Deployment, QFD), esta disenada para reconocer y agenciar las inquietudes de los consumidores. Los especialistas 
actuan conjuntamente para promover la calidad del producto y para que supla de manera efectiva las necesidades 
y preferencias del consumidor. 

Otro metodo comun para mejorar la calidad de un producto es el uso de los cfrculos de Control de Calidad 
(Quality Control, QC). Los cfrculos de control de calidad constan de un grupo pequeno de empleados (generalmente 
entre 5 y 12) que se reunen regularmente para solucionar problemas relacionados con el trabajo. Con frecuencia 
se conforman tanto con trabajadores en lfnea como con representantes de la gerencia; los miembros de estos 
cfrculos QC son todos de la misma area de trabajo y reciben capacitacion formal en control estadfstico de calidad 
y en planeacion de grupos. A traves de discusiones abiertas y del analisis estadfstico, los cfrculos QC pueden 
lograr mejoras significativas en diversas areas que van desde el mejoramiento de la calidad, el diseno del producto, 
la productividad y los metodos de produccion, hasta la reduction de costos y seguridad. Se estima que mas del 
90% de las 500 mejores companfas que aparecen en la revista Fortune utilizan de manera efectiva los cfrculos de 
control de calidad. 

Uno de los elementos mas importantes del TQM es un conjunto de herramientas y metodos estadfsticos 
utilizados para promover el Control Estadi'stico de Calidad ( Statistical Quality Control, SQC). Tales herramientas 
ayudan a organizar y analizar datos para efectos de solucionar problemas. Una de estas herramientas es el 
diagrama de Pareto, denominado asf en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los 
problemas de calidad que se presentan con mayor frecuencia o que han demostrado ser los mas costosos. La 
figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la produccion de homos microondas, 
comercializados por JC Penney. 


Figura 1.1 

Diagrama de Pareto 



automatica de la 

temperatura 

Defecto 


Fuente: QC Circle, JC Penney, 1993. 
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Los diagramas de Pareto con frecuencia expresan la regia 80/20: el 80% de todos los problemas se debe al 20% 
de las causas. Como lo demuestra la figura 1.1, aproximadamente el 75% de todos los problemas es causado por 
el dispositivo de descongelacion automatico y por el de conservation de la temperatura del homo. 

Hablando en terminos generales, el SQC esta disenado para asegurar que los productos cumplan con unas 
normas y especificaciones minimas de production. Este objetivo con frecuencia se promueve a traves del uso del 
muestreo de aceptacion , el cual es parte integral del SQC. El muestreo de aceptacion implica probar una muestra 
aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo el envio, o el lote. Esta 
decision se basa en parte en un nivel de calidad aceptable {Acceptable Quality Level , AQL), o numero maximo 
de defectos que una empresa esta dispuesta a tolerar. 

En las organizaciones se es cada vez mas consciente de la necesidad de mantener la calidad del producto. Si una 
firma va a competir de manera exitosa, debe tomar todas las precauciones para garantizar que sus productos cumplan 
con ciertos estandares basicos. Por tanto, no es ninguna exageracion insistir en la importancia de la TQM. Los 
principios inherentes al TQM estan aumentando en popularidad; representan la direction futura del analisis 
estadistico, aplicada al mundo de los negocios. En el capitulo 15 se analizara con mayor profundidad la TQM. 

C. Necesidad de la formation en estadistica 

Se podna pensar que el tipo de trabajo a que se aspira no necesitara del analisis estadistico. O quizas podrfa 
argumentarse que el personal de estadisticos de la companfa realizara el trabajo estadistico pertinente y que no 
existe la necesidad de manejar los detalles del analisis estadistico. 

Este no es el caso. Incluso si los estadisticos profesionales de la organization realizan el trabajo estadistico 
pertinente, es esencial poseer un cierto nivel de formation en este campo. Para determinar como puede ayudar el 
staff de estadistica al desempeno del trabajo de los otros, se debe conocer que es la estadistica, que hacen los 
estadisticos y como lo hacen. Cuando los problemas surgen se debe determinar como puede ayudar la estadistica. 
Para lograrlo, es necesario comprender los procedimientos estadisticos, y poder comunicarse con los estadisticos, 
en un esfuerzo conjunto para disenar soluciones adecuadas y tomar decisiones optimas. Una vez se ha adquirido 
esta familiaridad con el analisis estadistico, se sorprendera de las infinitas formas en que la estadistica puede 
ayudar en la solution de problemas que surgen con frecuencia en un escenario empresarial. 


1.4 Algunas definiciones basicas 

Toda rama de la investigation cientifica tiene su vocabulario propio y la estadistica no es la exception. Esta 
section revisa algunos de los terminos comunes utilizados en el analisis estadistico. Las definiciones y expresiones 
que siguen son esenciales para la comprension de como se realizan las pmebas estadisticas. 

A. Poblaciones y parametros 

En todo estudio estadistico, el investigador esta interesado en una determinada coleccion o conjunto de 
observaciones denominadas poblacion (o universo). Si los ingresos de los 121 millones de asalariados de los 
Estados Unidos son de interes para un economista que asesore al Congreso en la formulation del plan nacional 
tributario, entonces los 121 millones de ingresos constituyen la poblacion. Si se esta considerando un plan tributario 
para los perceptores de ingresos superiores a US $100,000, entonces tales ingresos superiores a US $100,000 
constituyen la poblacion. La poblacion es pues la coleccion completa de todas las observaciones de interes. 


Poblacion Es la recoleccion completa de todas las observaciones de interes para el 
investigador. 
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Si el director ejecutivo {Chief Executive Officer , CEO) de una gran empresa manufacturer desea estudiar la 
produccidn de todas las plantas de propiedad de la firma, entonces la produccion de todas estas plantas es la 
poblacidn. 

Un parametro es toda medida descriptiva de una poblacion. Algunos ejemplos son: el ingreso promedio de 
todos los asalariados de Estados Unidos, o la produccion total de todas las plantas manufactureras. El punto 
clave para recordar es que un parametro describe una poblacion. 


Parametro Es una medida descriptiva de la poblacion total de todas las observaciones 
|| de interes para el investigador. 


B. Muestras y estadi'sticos 

Aunque generalmente los estadisticos se interesan en algun aspecto de toda la poblacion, generalmente 
descubren que las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso 
promedio de cada uno de los 121 millones de asalariados seria una tarea abrumadora. Por consiguiente, 
generalmente debe ser suficiente estudiar tan solo una pequena porcion de dicha poblacion. A esta porcion mas 
pequena y mas manejable se le denomina muestra. Una muestra es un subconjunto de la poblacion seleccionado 
cientificamente. 


Muestra Es una parte representativa de la poblacion que se selecciona para ser 
estudiada ya que la poblacion es demasiado grande como para analizarla en su totalidad. 


Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula el ingreso promedio 
de una muestra de varios miles de asalariados seleccionados entre la poblacion total de 121 millones de trabajadores. 
El promedio de esta muestra se utiliza luego como una estimacion del ingreso promedio para toda la poblacion. Las 
muestras son necesarias porque estudiar las poblaciones completas resulta muy costoso y consume demasiado 
tiempo. 

Un estadistico es una medida descriptiva de una muestra. El ingreso promedio de esos varios miles de 
trabajadores, calculado por el Ministerio de Trabajo, es un estadistico. El estadistico es a la muestra lo que el 
parametro es a la poblacion. El estadistico sirve como una estimacion del parametro. Aunque en realidad el interes 
se fija en el valor del parametro de la poblacion, con frecuencia debe haber conformidad con solo calcularlo con 
un estadistico de la muestra que se ha seleccionado. 


Estadistico Elemento que describe una muestra y sirve como una estimacion del 
parametro de la poblacion correspond iente. 


C. Variables 

Una variable es la caracteristica de la muestra o poblacion que se esta observando. Si el asesor estadistico del 
alcalde de San Francisco esta interesado en la distancia que deben recorrer cada manana las personas que viajan 
diariamente largas distancias hacia el trabajo, la variable es millas recorridas . En un estudio respecto al ingreso 
de los asalariados en Estados Unidos, la variable es ingreso . 
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Variable Es una caracterlstica de la poblacion que se esta analizando en un estudio 
estadfstico. 


Una variable puede ser (1) cuantitativa o (2) cualitativa. Si las observaciones pueden expresarse numericamente, 
entonces es una variable cuantitativa. Los ingresos de todos los asalariados son un ejemplo de una poblacion 
cuantitativa. Otros ejemplos incluyen la estatura de las personas en las que se esta interesado, los puntajes que 
los estudiantes reciben en un examen final de estadfstica, y el numero de millas que las personas recorren cada 
manana al ir a su sitio de trabajo en San Francisco. En cada caso, las observaciones se miden numericamente. 

Una variable cualitativa se mide de manera no numerica. El estado civil de quienes solicitan credito, el sexo de 
los estudiantes en una clase de estadfstica, y la raza, color de cabello, preferencia religiosa de las personas que 
recorren largas distancias a su trabajo en San Francisco, son ejemplos de variables cualitativas. En cada caso las 
observaciones se miden de manera no numerica. 

Ademas las variables pueden ser (1) continuas o (2) discretas. Una variable continua es aquella que puede 
tomar cualquier valor dentro de un rango dado. No importa que tan cerca puedan estar dos observaciones, si el 
instrumento de medida es lo suficientemente preciso, puede hallarse una tercera observation que se encuentre 
entre las dos primeras. Una variable continua generalmente resulta de la medicion. 

Una variable discreta esta limitada a ciertos valores, generalmente numeros enteros. Con frecuencia son el 
resultado de la enumeration o del conteo. El numero de estudiantes de la clase y el numero de autos vendidos por 
General Motors son algunos ejemplos. En ningun caso se observaran valores fraccionarios. 

A traves del estudio de la estadfstica se hara referenda en repetidas ocasiones a estos conceptos y terminos. 
Se debe ser consciente del papel que juega cada uno de ellos en el proceso de analisis estadfstico. Es de especial 
importancia poder diferenciar entre una poblacion y sus parametros, y entre una muestra y sus estadfsticos. 


1.5 La importancia del muestreo 

Gran parte del trabajo de un estadfstico se realiza con muestras. Las muestras son necesarias debido a que con 
frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Es muy costoso y demanda 
mucho tiempo examinar la poblacion total, por tanto, debe seleccionarse una muestra de la poblacion, calcular el 
estadfstico de la muestra, y utilizarlo para estimar el parametro correspondiente de la poblacion. 

Este analisis sobre las muestras implica una distincion entre las dos principals ramas del analisis estadfstico: 
(1) la estadfstica descriptiva y (2) la estadfstica inferencial. La estadfstica descriptiva es el proceso de recolectar, 
agrupar y presentar datos de una manera tal que describa facil y rapidamente dichos datos. Los capftulos 2 y 3 
analizan la estadfstica descriptiva e ilustran los diversos metodos y herramientas que pueden utilizarse para 
presentar y resumir grandes conjuntos de datos. 

La estadfstica inferencial involucra la utilization de una muestra para sacar alguna inferencia o conclusion 
sobre la poblacion de la cual hace parte la muestra. Cuando el Ministerio de Trabajo utiliza el ingreso promedio de 
una muestra de varios miles de trabaj adores para calcular el ingreso promedio de los 121 millones de trabajadores, 
esta utilizando una forma simple de estadfstica inferencial. 

La exactitud de toda estimation es de enorme importancia. Esta exactitud depende en gran parte de la forma 
como se tomo la muestra, y del cuidado que se tenga para garantizar que la muestra proporcione una imagen 
confiable de la poblacion. Sin embargo, con mucha frecuencia se comprueba que la muestra no es del todo 
representativa de la poblacion y resultara un error de muestreo. El error de muestreo es la diferencia entre el 
estadfstico de la muestra utilizada para calcular el parametro de la poblacion y el valor real pero desconocido del 
parametro. 
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Error de muestreo Es la diferencia entre el parametro desconocido de la poblacion y 
II el estadistico de la muestra utilizado para calcular el parametro. 


Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo es el azar en el 
proceso de muestreo. Debido al factor azar en la seleccion de elementos de la muestra, es posible seleccionar sin 
darse cuenta, elementos atfpicos que no representan la poblacion. Por ejemplo, en el esfuerzo por estimar la media 
poblacional es factible que se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo 
asi una sobreestimacion de la media poblacional. Por otro lado, el azar puede producir un gran numero de 
elementos de muestra que sean inusualmente pequenos, produciendo una subestimacion del parametro. En 
cualquiera de los dos casos, ha ocurrido un error de muestreo. 

Una forma mas seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre cuando hay alguna 
tendencia a seleccionar determinados elementos de muestra en lugar de otros. Si el proceso de muestreo se disena 
de manera incorrecta y tiende a promover la seleccion de demasiadas unidades con una caracterfstica en especial, 
a expensas de las unidades que no tienen dicha caracterfstica, se dice que la muestra esta sesgada. Por ejemplo, 
el proceso de muestreo puede favorecer de manera inherente la seleccion de hombres excluyendo a las mujeres, 
o de personas casadas excluyendo a las solteras. 


Sesgo muestral Es la tendencia a favorecer la seleccion de ciertos elementos de 
muestra en lugar de otros. 


Un manejo mas riguroso del sesgo en el muestreo se presenta en un capitulo posterior. Aunque el error de 
muestreo nunca puede medirse debido a que el parametro permanece desconocido, se debe ser consciente de que 
existe la probabilidad que esto ocurra. 


1.6 Las funciones de la estadistica 

En repetidas ocasiones se ha enfatizado la utilidad de la estadistica y la amplia variedad de problemas que puede 
resolver. Para ilustrar de manera mas completa esta amplia aplicabilidad, es necesario analizar las diversas funciones 
de la estadistica. La estadistica es la ciencia que tiene que ver con la (1) recoleccion, (2) organizacion, (3) 
presentacion, (4) analisis, e (5) interpretation de datos. 

Aunque en todo estudio estadistico el primer paso es la recoleccion de datos, es usual en un curso basico de 
estadistica asumir que los datos ya han sido recolectados y que ahora estan disponibles. Por consiguiente, el 
trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa y descriptiva. Los 
datos deben colocarse en un orden logico que revele rapida y facilmente el mensaje que contienen. Este 
procedimiento constituye el proceso de la estadistica descriptiva, tal como se define y se discute en los capitulos 
siguientes. Luego de que los datos se han organizado y se han presentado para su revision, el estadistico debe 
analizarlos e interpretarlos. Estos procedimientos se basan en la estadistica inferencial y constituyen un importante 
beneficio para el analisis estadistico, mediante la ayuda en el proceso de toma de decisiones y solution de 
problemas. 

Se descubrira que a traves de la aplicacion de procedimientos estadisticos precisos, es posible predecir el 
futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las presiones competitivas puede beneficiarse 
considerablemente de la capacidad para anticipar las condiciones del negocio, antes que estas ocurran. Si una 
empresa sabe como van a estar sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes 
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mas exactos y efectivos respecto a las operaciones actuates. Si se calculan las ventas futuras con un grado de 
exactitud confiable, la gerencia puede tomar facilmente decisiones importantes respecto a los niveles de inventario, 
pedidos de materia prima, contrataciones de empleados y, virtualmente, sobre cada aspecto de las operaciones del 
negocio. 


1.7 Escalas de medida 

Las variables pueden clasificarse con base en su escala de medida. La manera en que se clasifican las variables 
afecta en gran parte la forma como se utilizan en el analisis. Las variables pueden ser (1) nominates, (2) ordinates, 
(3) de intervalo, o (4) de razon. 

Una medida nominal se crea cuando se utilizan nombres para establecer categories dentro de las cuales las 
variables pueden registrarse exclusivamente. Por ejemplo, el sexo puede clasificarse como “hombre” o “mujer”. Se 
podrfa codificar tambien con un “1” o un “2”, pero los numeros servirian tan solo para indicar las categorias y no 
tendrian significado numerico; los calculos matematicos que utilizan estos codigos no tendrian sentido. Las 
bebidas colas pueden clasificarse como Coca-Cola, Pepsi, 7-Up, o Ate 8. Cada bebida podria registrarse en una de 
estas categorias excluyendo las otras. 


Mediciones en escala nominales Nombres o clasificaciones que se utilizan para 
datos en categorias distintas y separadas. 


La tabla 1 . 1 ilustra la forma como la revista Money clasifico diferentes fondos de inversion. Vale la pena 
destacar que cada fondo esta ubicado en una categorfa en particular, con base en su comportamiento financiero. 

Tabla 1.1 

Medidas en escala nominales 
de los fondos de inversion 


Categoria / Nombre del Fondo 


Crecimiento Agresivo 

Fondos del Mercado Monetario 

Twenty Century Growth 

Alger Portfolio 

Janus 

Mariner Government 

Reembolso Total 

Exento de Impuestos 

Scudder 

Kemper Municipals 

Vanguard Star 


PaxWorld 


USAA Cornerstone 


Bonos 


Strong Short-Term 


Scudder Short-Term 



Fuente: Money, julio, 1992. 
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Es importante recordar que una medida en escala nominal no indica ningun orden de preferencia, sino que 
simplemente establece una disposition categorica en la cual se puede ubicar cada observation. 

A diferencia de una medida en escala nominal, una medida en escala ordinal si muestra un ordenamiento o 
secuencia de los datos. Es decir, que las observaciones se clasifican con base en algunos criterios. Sears Roebuck, 
uno de los vendedores minoristas mas grandes de Estados Unidos, clasifica muchos de sus productos como 
“buenos”, “mejores” y “los mejores”. Las encuestas de opinion con frecuencia utilizan una medida en escala 
ordinal como “totalmente de acuerdo”, “de acuerdo”, “sin opinion”, “en desacuerdo”, y “en total desacuerdo”. 

A1 igual que con los datos nominales, los numeros pueden utilizarse para ordenar los rangos. Y al igual que 
con los datos nominales, la magnitud de los numeros no es importante; el rango depende solo del orden de los 
valores. Sears hubiera podido utilizar los rangos de “1”, “2”, y “3”, o “1”, “3,”, y “12” para este asunto. Las 
diferencias aritmeticas entre los valores carecen de sentido. Un producto con rango “2” no es dos veces mejor 
que uno con rango “1”. 


Medidas en escala ordinales Son las que clasifican las observaciones en categorias 
con un orden significativo. 


El mismo tema que la revista Money menciono anteriormente, presento los rangos para las inversiones con 
base en los niveles de riesgo mostrados en la tabla 1 .2. Vale la pena destacar que los rangos de riesgo “Muy alto”, 
“Alto” , y “Bajo” se hubiera podido basar en los valores “1”, “2”, y “3”, o “A”, “B”, y “C”. Pero las diferencias 
reales en los niveles de riesgo no pueden medirse de manera significativa. Se sabe solamente que una inversion 
de rango “Alto” tiene mayor riesgo que una con rango “Bajo”. 


Tabla 1.2 

Rango ordinal del 
riesgo de inversion 


Inversion 

Factor de riesgo 

Oro 

Muy alto 

Companias de poco crecimiento 

Muy alto 

Maxima ganancia de capital 

Alto 

Internacional 

Alto 

Ingreso de opciones 

Bajo 

Equilibrado 

Bajo 


En una escala de intervalo las variables se miden de manera numerica, y al igual que los datos ordinales, llevan 
inherente un rango u ordenamiento. Sin embargo, a diferencia de los rangos ordinales, la diferencia entre los 
valores es importante. Por eso, las operaciones aritmeticas de suma y resta, son signiflcativas. La escala Fahrenheit 
para las temperaturas es un ejemplo de una escala de intervalo. 70 grados no es solo una temperatura mas alta que 
60 grados, sino que la misma diferencia de 10 grados existe entre 90 y 100 grados Farenheit. 

En una escala de intervalos el valor de cero se selecciona arbitrariamente. No existe nada concreto que haya 
obligado a fijar la temperatura cero grados, sino que, simplemente, es un punto de referenda arbitrario. Hubiera 
podido crearse la escala Fahrenheit de manera que cero se hubiera establecido en una temperatura mas caliente (o 
mas frfa). No se da a cero un significado distinto al decir que es 10 grados mas frfo que 10 grados Fahrenheit. Asf, 
80 grados no es dos veces mas caliente que 40 grados y la relation 80/40 no tiene significado. 


Medidas en escala de intervalo Medidas en una escala numerica en la cual el valor 
de cero es arbitrario pero la diferencia entre valores es importante. 
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De todos los cuatro niveles de medida, solo la escala de razon se basa en un sistema numerico en el cual el cero 
es significativo. Por tanto, las operaciones de multiplication y division tambien toman una interpretation racional. 
Una escala de razon se utiliza para medir muchos tipos de datos que se encuentran en el analisis empresarial. 
Variables tales como costos, rentabilidad y niveles de inventario se expresan como medidas de razon. El valor de 
cero dolares para medir los ingresos, puede interpretarse de manera logica para explicar que no ha habido ventas. 
Ademas, una firma con una participacion en el mercado del 40% tiene dos veces mas participacion que una firma 
con participacion en el mercado del 20%. Las medidas tales como peso, tiempo y distancia tambien se miden en 
una escala de razon, ya que cero es significativo y un artfculo que pesa 100 libras tiene la mitad del peso de un 
articulo que pesa 200 libras. 


Medidas en escala de razon Medidas numericas en las cuales cero es un valor fijo en 
cualquier escala y la diferencia entre valores es importante. 


Vale la pena destacar que las cuatro escalas de medida incrementan en complejidad, progresando desde la 
medida en escala nominal rudimentaria, a una medida en escala de razon mas refinada. Cada medida ofrece mas 
informacion sobre la variable que la anterior. Esta distincion entre los diversos grados de refinamiento es importante, 
debido a que las diferentes tecnicas estadisticas requieren de distintas escalas de medida. A pesar de que la 
mayorfa de las pruebas estadisticas requieren medidas en escala de intervalo o de razon, otras pruebas denominadas 
pruebas no parametricas (que se analizaran mas tarde en este texto), estan disenadas para utilizar datos ordinales 
o nominales. 


Ejercicios del capitulo 

1. La directora de produccion para la planta de Ford Motor Company , en Cleveland, debe informar a su superior 
sobre el numero de dias promedio que los empleados de la planta se ausentan del trabajo. Sin embargo, la 
planta emplea mas de dos mil trabajadores, y la directora de produccion no tiene tiempo de revisar los 
registros personales de cada empleado. Como asistente usted debe decidir como puede ella obtener la 
informacion necesaria. <?,Que consejo podrfa darle? 

2. Describa en sus propias palabras como puede utilizarse la estadistica para solucionar problemas en varias 
disciplinas y ocupaciones. 

3. ^Que ocupacion especifica planea seguir despues de su grado? Si no esta seguro, seleccione el area en la cual 
esta interesado. Utilizando ejemplos especificos analice detalladamente los tipos de problemas que pueden 
surgir y las decisiones que tendra que tomar cuando el analisis estadistico pruebe ser de utilidad. 

4 . ^De que forma utilizara los servicios del estadistico profesional en su organization una vez que usted encuentre 
empleo? [ Por que es poco probable escaparse de la necesidad de tener un conocimiento basico en estadistica? 

5. Describa en sus propios terminos la diferencia entre una poblacion y una muestra; entre un parametro y un 
estadistico. 

6. ^Cual es la diferencia entre una variable cuantitativa y una variable cualitativa? De ejemplos. 

7. Diferencie entre una variable continua y una variable discreta. De ejemplos de cada una. 

8. Un informe reciente en la revista Fortune revelo que los japoneses pronto controlaran hasta un 35% de las 
ventas de autos en los Estados Unidos; comparado con el 28% de finales de los anos 80 esta apenas un 8% 
por encima de lo ocurrido en 1970. ^Esta informacion contiene estadistica descriptiva, inferencial, o ambas? 
Explique. 
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9 . ^Cual es la diferencia entre la estadistica descriptiva y la estadistica inferential? ^Cual cree usted que constituye 
una forma mas elevada de analisis estadistico y por que? 

10 . ^En que usos o funciones se puede aplicar la estadistica? ^Como cree usted que pueda utilizarse para 
solucionar problemas comerciales en el mundo real? De ejemplos de problemas especificos que puedan surgir 
y explique como podrfa utilizarse la estadistica para desarrollar soluciones y respuestas. 

11 . Seleccione una poblacion cualquiera que sea de su interes. Identifique variables cuantitativas y cualitativas 
de esa poblacion que puedan seleccionarse para ser estudiadas. 

12 . Si los estadisticos estan interesados realmente en poblaciones, ^por que generalmente trabajan con muestras? 

13 . Analice si las siguientes variables son discretas o continuas: 

a. Numero de cursos que los estudiantes de su colegio estan cursando este semestre. 

b. Numero de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders. 

c. Peso de los companeros de equipo de Tim Brown. 

d . Peso del contenido de las cajas de cereal. 

e. Numero de libros que usted leyo el ano pasado. 

14 . Defina el error de muestreo y explique que lo causa. 

15 . La revista Forbes (febrero de 1997) reporto datos sobre las condiciones y estilos de vida en varias ciudades 
de Estados Unidos. Algunos de esos datos se reproducen aqui. 


Ciudad 

Poblacion 
en millones 

Mediana 
del ingreso 
por hogar 

Mejor 

negocio 

hotelero 

Atraccion 
mas visitada 

Tasa 

de criminalidad 
por cada 100,000 

Atlanta 

3.5 

US$43,249 

Ritz-Carlton 

Stone Mountain 

846.2 




Buckhead 

Park 


Baltimore 

2.5 

43,291 

Harbor Count 

Harborplace 

1,296.5 

St. Louis 

2.5 

39,079 

Hyatt Regency 

Gateway Arch 

263.4 

Philadelphia 

5.0 

43,576 

Bellevue 

Liberty Bell 

693.1 

Raleigh-Durham 

1.0 

40,990 

Radisson Plaza 

State Fair 

634.9 


a . Identifique las variables cualitativas y cuantitativas. 

b. ^Cuales variables son discretas y cuales continuas? 

c. Identifique cada variable como nominal, ordinal, o de razon. 

d. ^Cuales son descriptivas y cuales inferenciales? 

16 . El presidente de una fratemidad en el campus desea tomar una muestra de las opiniones de 112 miembros 
respecto a las actividades urgentes para el otono. 

a. ^Cual es la poblacion? 

b. ^Cual es la mejor forma como debe tomarse una muestra? 

17 . El productor de television del programa de drama diumo All My Children va a tomar una muestra entre los 
televidentes, para saber sus sentimientos sobre los planes de asesinar a un personaje popular. ^Cuales 
problemas pueden surgir en este esfuerzo? ^Que recomendarfa usted y por que? 
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18 . La General Mills esta preocupada con el peso del contenido neto de las cajas de cereal Cheerios que sale de 
la lfnea de produccion de su planta en Detroit. La caja anuncia 36 onzas, y si en realidad hay menos contenido 
en la caja, a General Mills la podrfan multar por falsa publicidad. Como miembro del equipo administrativo 
recien contratado en General Mills usted sugiere que se abra una muestra de las cajas y se pese su contenido. 
El vicepresidente de la division de control de calidad pregunta que tipo de muestra deberia tomarse. ^Que le 
responderia? 

19 . Debido a que la produccion se ha reducido en la planta de General Mills, ^es posible en realidad abrir todas 
las cajas producidas durante el penodo de produccion mas reciente? Dicho proceso evitarfa el error de 
muestreo y producirfa resultados mas exactos. Ya que la poblacion de todas las cajas no es muy grande, ^es 
necesario el muestreo? 

20 . ^Que nivel de medicion utilizarfa usted en cada uno de los siguientes casos? Explique su respuesta. 

a. Un sistema para medir las preferencias de los clientes respecto a los vehiculos con base en su estilo (como 
convertible, van, camion, sedan, etc.). 

b. Un sistema para evaluar a los empleados con base en el numero de dias que faltan al trabajo. 

c. Un sistema para identificar las ciudades de nacimiento de los clientes. 

d. Un sistema para registrar la poblacion de las ciudades en las cuales viven los clientes. 

21 . ^En cual escala de medida puede expresarse cada una de estas variables? Explique su respuesta. 

a. Los estudiantes clasifican a su profesor de estadistica sobre una escala de “Terrible”, “No tan Malo”, 
“Bueno”, “Maravilloso”, y “Dios Griego”. 

b. Los estudiantes en una universidad estan clasificados por profesion, tales como marketing, administration 
y contaduna. 

c. Los estudiantes estan clasificados por cursos utilizando los valores 1, 2, 3, 4, y 5. 

d. Agrupar mediciones de lfquidos en octavo, cuarto y galon. 

e. . Edades de los clientes. 

22 . Cite varios ejemplos de comerciales de radio o television que utilicen la estadistica para vender sus productos. 
^Utilizan estadistica descriptiva o inferencial? ^Que escala de medida utilizan? 


EN ESCENA 

miles en los afios venideros, tan s61o para cargos de 
sustitucion. Se espera que el crecimiento laboral sea el 
mas alto hasta el aio 2005. Los analistas gereneiales y 
consultores son otro grupo laboral que requiere de fuertes 
habilidades cuantitativas. En este grupo se proyecta que 
el crecimiento laboral sea superior al promedio. Lo mismo 
se aplica para los economistas y los analistas en 
investigation de mercados. 

En el Occupational Outlook Handbook en la 
universidad o en la biblioteca publica, se buscan trabajos 
en las areas de interes. ^Cuales son las necesidades de 
habilidades cuantitativas para este? ^Cuales son las 
proyecciones de crecimiento laboral? 



PUESTA 


El Manual sobre Perspectivas Ocupacionales 
( Occupational Outlook Handbook , edition 1996 - 1997), 
publicado por el Ministerio de Trabajo de Estados Unidos, 
se encuentra disponible en varias bibliotecas. Contiene 
informacidn extensa sobre los trabajos en cerca de 250 
categories ocupacionales que abarcan casi el 90% de los 
trabajos en la economia de los Estados Unidos. El manual 
proporciona descriptions detalladas sobre las 
responsabilidades laborales, las condiciones de trabajo, la 
compensacidn, la capacitacion y las proyecciones de 
crecimiento laboral para el periodo comprendido entre 1995 
y 2005. 

Se proyecta que las vacantes para especialistas en 
informatica y analistas de sistemas seran de cientos de 
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Del escenario a la vida real 

Existe una cantidad de information laboral y de la carrera que se encuentra disponible en el Internet. Los dos sitios 
lider en listados laborales son Monster Board (www.monster.com) y America’s Job Bank (www.ajb.dni.us). Utilizando 
las palabras clave de busqueda, ensaye su interes ocupacional en las areas de biisqueda de trabajo en estos dos 
sitios (las palabras clave pueden obtenerse del Occupational Outlook Handbook en la biblioteca). nivel 
national, o “estatal”, cuantas vacantes hay en el campo de su interes? ^Como se distribuyen geograficamente 
estos trabajos? ^Que informacion sobre salarios se proporciona en los destinos laborales? 

Explore las categorfas de “Empleo” y “Trabajos” suministradas por los principales motores de busqueda 
como Yahoo! para ponerse al corriente con otros servicios de la carrera disponibles en Internet. En especial, 
busque los recursos para la planeacion de la carrera, hojas de vida e informacion salarial. 
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Descripcion 
de los conjuntos 
de datos 
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Plan del capi'tulo 


Este capftulo presenta ilustraciones y ejemplos de las multiples formas en que se puede organizar y manejar un 
fffW 1 ™ 10 grande de datos para proporcionar una interpretation visual rapida de la information que dste contiene. 
Dtchas herramientas estadfsticas permiten describir un conjunto de datos originales de manera concisa y facil de 


Description de los conjuntos 
de datos 


Distribuciones 
de frecuencias 


Graficos 


Distribucion 
de frecuencia 
acumulada 


Histograma 


Distribucion 
de frecuencia relativa 


Diagrama de barras 


Diagrama circular 


Tablas 

de contingencia 


Grafico de maximos- 
mmirnos y al cierre 


Diagrama 
de tallo y hoja 
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E S C E 


Los estudiantes de college que planean tomar las vacaciones 
de primavera del ano, se enfrentan con las tarifas de alquiler 
de autos mas altas que se hayan presentado {Newsweek, 
febrero 1997). Una encuesta realizada por Business Travel 
News re veld que en 1996 las tasas aumentaron 1 1 .8%, y se 
anticipa que el incremento para 1997 estara por encima de 
dicho porcentaje. Los incrementos en los costos laborales, 
seguros y costos de parqueo, se mencionan como las 
principales causas de estos incrementos poco comunes en 
los gastos para viajes. 

Lo mds alarmante para los estudiantes que desean 
escaparse de los rigores de la academia es el hecho de que se 
esperan incrementos mucho mayores en las tasas, en las 
ciudades que parecen ser los lugares favoritos para pasar 
vacaciones, incluyendo Miami, Houston, Phoenix, las 
ciudades de California del sur, y otros lugares con clima 
calido. Como lo muestra el diagrama circular, estas areas 
populares ya exceden el promedio nacionai en un monto 
substancial. Mientras que los viajeros de toda la nation 
pagan un promedio de aproximadamente $33 ddlares por 
dia, las tasas en estas £rea$ de mayor preferencia se 
aproximan a $80 ddlares. 



N A R I 0 


Para empeorar las cosas, para las personas que toman 
sus vacaciones este verano, la disponibilidad puede ser un 
problema. Las empresas de alquiler de autos hacen que 
quienes tienen plan de viajar reserven con anticipation. 
Pobre del estudiante quien, con suenos de pasear por Miami 
en un convertible deportivo, deba conformarse con un 
sedan cuatro puertas! 

Sin embargo, muchas empresas que alquilan autos 
pretenden multar con un jugoso incremento en las tarjetas 
de credito a quienes han reservado un carro pero no se 
presentan a recogerlo a la hora acordada. 

A1 preparar las tan esperadas y bien merecidas 
vacaciones de primavera se sugiere contactar a varias 
compamas que alquilen autos y recolectar information 
sobre las tarifas y tipo de autos. Para ayudar a tomar esta 
importante decisidn respecto a que tipo de auto alquilar, 
se debe preparar un resumen de estos detalles importantes 
para que los companeros de viaje compiementen con 
gr&ficos y otros medios de description de conjuntos de 
datos analizados en este capitulo. 


Tarifas diarias de alquiler de autos 



2.1 Introduction 

Casi todos los trabajos que se hacen en estadfstica comienzan con el proceso de recoleccion de datos necesarios 
para formar con ellos un conjunto que se utilizara en el estudio. Para propositos generales, se adoptara la 
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suposicion conveniente de que esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos estan 
disponibles. 

Esta recoleccidn de datos originales revela muy poco por si sola. Es extremadamente dificil determinar el 
verdadero significado de un grupo de numeros que simplemente se han registrado en un papel. Nuestra labor es 
organizar y describir tales datos de manera concisa y significativa. Para determinar su significancia, los datos se 
organizan de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden decimos. 

Entre las herramientas estadisticas que resultan de particular utilidad para organizar los datos se incluyen: 

• Tablas de frecuencia que colocan todos los datos en clases especificas. 

• Diversos graficos que pueden proporcionar una representation visual de los datos. 

• Tablas de contingencia y diagramas de “tallo y hoja”, los cuales tambien permiten la presentation de un 
conjunto grande de datos de manera concisa y discernible. 


2.2 Metodos de agrupacion de datos 

Pueden utilizarse varias herramientas basicas para describir y resumir un conjunto grande de datos. La manera 
m&s simple, pero quizas la mas significativa, es la serie ordenada. Se asume que los puntajes de Cl de cinco recien 
graduados de la Universidad de Podunk son 75, 73, 91, 83 y 80. Una serie ordenada simplemente enumera tales 
observaciones en orden ascendente o descendente. Los cinco valores pueden aparecer como 73, 75, 80, 83, 91. La 
serie ordenada proporciona alguna agrupacion al conjunto de datos; por ejemplo, se puede ver de inmediato que 
los dos valores extremos son 73 y 91. Sin embargo, la utilidad de una serie ordenada es limitado. Se necesitan 
mejores tecnicas para describir nuestro conjunto de datos. El resto de esta section analiza algunos metodos 
comunes para agrupar una recoleccion de datos amplia, facilitando asi la comprension total de la informacion que 
contienen. 


A. Distribution de frecuencias 

Como estadistico residente de Pigs and People (P&P) Airlines, el director de la division de analisis estadistico le 
pide recolectar y agrupar los datos sobre el numero de pasajeros que han decidido viajar con P&P. Tales datos 
correspondientes a los ultimos 50 dias aparecen en la tabla 2.1. Sin embargo, con estos datos en bruto, es 
improbable que el director pueda obtener informacion util y significativa respecto a las operaciones de vuelo. Los 
datos no estan organizados y es dificil llegar a una conclusion significativa simplemente revisando una serie de 
numeros anotados en un papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para 
facilitar el acceso a la informacion que contienen. Primero se analizara como puede utilizarse una distribution de 
frecuencia para organizar el conjunto de datos. 


Tabla 2.1 

68 


72 

Datos brutos 

50 

sobre el numero 

70 

de pasajeros 

65 

83 

de P&P Airlines 

77 


78 


80 


93 


71 

77 

83 

79 

74 

57 

67 

69 

60 

70 

66 

76 

84 

59 

75 

94 

72 

85 

79 

71 

84 

74 

82 

97 

73 

78 

93 

95 

81 

79 

90 

83 

84 

91 

101 

86 

92 

102 

80 

69 
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Una distribution de frecuencias (o tabla de frecuencias) ordenara los datos si estos se dividen en clases y se 
registrar^ el numero de observaciones en cada clase, tal y como se muestra en la tabla 2.2. Por ejemplo, ahora se 
puede ver facilmente, que en 18 de los 50 dfas, entre 70 y 79 pasajeros volaron en P&P. En ningun momento la lista 
de pasajeros diarios excedio de 109. La aerolmea rara vez transporto menos de 60 pasajeros. El director puede 
ahora detectar caracterfsticas que no eran evidentes en el analisis de datos en bruto de la tabla 2.1. Estas 
caracterfsticas son utiles para la toma de decisiones inteligentes y bien informadas respecto a las operaciones de 
vuelo. 


Tabla 2.2 

Distribution 
de freeuencia 
para pasajeros 
de aeroh'neas 
P&P 


Clase (pasajeros) 


Cuenta 

Freeuencia (dfas) 

Punto medio (M) 

50 a 59 

mi 


3 

54.5 

60 a 69 

Mill 

ii 

7 

64.5 

70 a 79 

Mill 

Mill Mill III 

18 

74.5 

80 a 89 

Mill 

Mill II 

12 

84.5 

90 a 99 

Mill 

III 

8 

94.5 

100 a 109 

II 


2 

104.5 




50 



Observe que cada clase tiene un limite inferior y un limite superior. Los valores exactos de estos lfmites son 
muy importantes. Si los datos en una tabla de frecuencias son continuos, es necesario permitir valores fraccionarios. 
Nuestros lfmites de clase aparecerfan como: 


50 y menos de 60 
60 y menos de 70 
70 y menos de 80 


Claro que P&P no puede transportar una fraction de pasajero, de manera que la naturaleza discreta del conjunto 
de datos reales permite el uso de los lfmites vistos en la tabla 2.2. El numero de clases en una tabla de frecuencias 
es algo arbitrario. En general, la tabla deberfa tener entre 5 y 20 clases. Muy pocas clases no revelarfan ningun 
detalle sobre los datos y demasiadas clases serfa tan confuso como la misma lista de datos originates . 

Se puede seguir una regia simple para aproximar el numero de clases a utilizar, c, es: 


Determina el numero 2 C > « [2-1] 

de clases 


en donde n es el numero de observaciones. El numero de clases es la menor potencia a la cual se eleva 2, de manera 
que el resultado sea igual a o mayor que el numero de observaciones. En el ejemplo de P&P, se tiene que n = 50 
observaciones. Asf, 


2 C > 50 
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Despejando c , lo cual puede hacerse facilmente con una calculadora manual, se encuentra que 2 6 - 64. Esta regia 
sugiere que deberfa haber seis clases en la tabla de frecuencias. Por razones de conveniencia, puede utilizarse un 
numero mayor o menor de clases. 

El punto medio de la clase, A/, se calcula como promedio de los lfmites superior e inferior de dicha clase. El 
punto medio para la primera clase en la tabla 2.2 es 50 + 59/2 = 54.5. 

Elintervalo de clase es el rango de valores encontrados dentro de una clase. Se determina restando el Iimite 
superior (o inferior) de una clase del Iimite inferior (o superior) de la clase siguiente. El intervalo para la primera 
clase en la tabla 2.2 es (60 - 50) = 10. Es deseable que todos los intervalos de clase sean de igual tamano, ya que 
facilita las interpretaciones estadfsticas en usos subsiguientes. Sin embargo, puede ser conveniente utilizar 
intervalos abiertos que no mencionan un Iimite inferior para la primera clase o un Iimite superior para la ultima 
clase. La ultima clase en la tabla 2.2 puede leerse “100 y mas”. 

En la construction original de una tabla de frecuencia, el intervalo de clase puede determinarse como: 


Intervalo de clase para ^ Valor mas grande - valor mas pequeno 

una tabla de frecuencia Numero deseado de clases 


Ya que se deciden seis clases para la tabla de frecuencia, el intervalo de clase se convierte en: 


Debido a que 8.7 es un numero poco practico, el intervalo puede ajustarse levemente hacia arriba o hacia abajo. 
Por razones de conveniencia, se selecciono el intervalo de 10 para formar la tabla 2.2. 

Con frecuencia se desea determinar el numero de observaciones que son “mayor que” o “menor que” alguna 
cantidad. Esto puede lograrse con una distribucion de frecuencia acumulada “mas de” o una distribucion de 
frecuencia acumulada “menor que”. Una distribucion de frecuencias acumuladas “mas de” se forma restando las 
frecuencias de las clases anteriores tal como se observa en la tabla 2.3. En los 50 dfas, por lo menos 50 pasajeros 
abordaron P&P Airlines. Por tanto, la frecuencia acumulada para la primera clase de la tabla 2.3 es 50. En tres de 
esos dfas, menos de 60 pasajeros compraron pasajes. Por tanto, la frecuencia acumulada de la segunda clase es 47 
(50 - 3). Debido a que el numero de pasajeros fue menor de 70 en 10 dfas, la frecuencia acumulada para la tercera 
clase es 40 (50 - 10). Las frecuencias acumuladas para las clases restantes se determinan de forma similar. 


Tabla 2.3 

Distribucion 

Clase 

(pasajeros) 

Frecuencia 

(di'as) 

Frecuencia acumulativa 
(di'as) 

de frecuencias 

50 o mas 

3 

50 

acumuladas 

60 o mas 

7 

47 

"mas de" del 

70 o mas 

18 

40 

numero de 

80 o mas 

12 

22 

pasajeros 

90 o mas 

8 

10 


100 o mas 

2 

2 


110 o mas 

0 

0 


Una distribucion de frecuencia acumulada “menor que” se construye sumando las frecuencias de cada clase. 
La tabla 2.4 muestra que en ningun momento volaron menos de 50 pasajeros en P&P. La frecuencia acumulada de 
la primera clase por tanto es cero. En tres dfas, menos de 60 pasajeros abordaron vuelos. La frecuencia acumulada 
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de la segunda clase es tres. Debido a que hubo 10 dias en los cuales menos de 70 pasajeros volaron, la tabla 2.4 
muestra que la frecuencia acumulada de la tercera clase es 3 + 7 = 10. De nuevo las frecuencias acumuladas de las 
clases restantes se determinan de manera similar. 


Tabla 2.4 

Distribucion 

Clase 

(pasajeros) 

Frecuencia acumulada 
(dias) 

Frecuencia 

(dias) 

de frecuencia 

Menos de 50 

0 

0 

acumulada 

Menos de 60 

3 

3 

"menor que" 

Menos de 70 

7 

10 

para el numero 

Menos de 80 

18 

28 

de pasajeros 

Menos de 90 

12 

40 


Menos de 100 

8 

48 


Menos de HO 

2 

50 


Finalmente, una distribucion de frecuencia relativa expresa la frecuencia dentro de una clase como un porcentaje 
del numero total de observaciones. En nuestro caso actual, la frecuencia relativa de una clase se determina como 
la frecuencia de dicha clase dividida por 50. Por ejemplo, la tabla 2.5 muestra que la frecuencia relativa de la tercera 
clase es 18/50 = 36%. Esto permite sacar conclusiones sobre el numero de observaciones en una clase respecto a 
toda la muestra. 


Tabla 2.5 

Distribucion 

Clase 

(pasajeros) 

Frecuencia 

(dias) 

Frecuencia 

relativa 

de frecuencia 

50-59 

3 

3 - 50 = 6% 

relativa para 

60-69 

7 

7 -r 50 = 140/o 

pasajeros 

70-79 

18 

18 4- 50 = 36o/o 


80-89 

12 

12-50 = 240/o 

90-99 

8 

8 - 50 = 160/o 

100-109 

2 

2 - 50 = 40/o 


50 

lOOO/o 


Casi todo el trabajo estadfstico que se encuentra puede realizarse facil y rapidamente con la ayuda de los 
computadores modemos. La pantalla 2.1 contiene la tabla de frecuencias para los datos de los pasajeros de P&P, 
creado en Microsoft Excel. Se puede especificar el lfrnite superior de cada clase. Despues, las observaciones se 
colocan en las clases correspondientes. La mayorfa de los paquetes de computador crearan un resultado similar. 

Pantalla 2.1 

Tabla de frecuencias para datos de pasajeros de P&P 

BIN FREQUENCY CUMULATIVE % 


59 

3 

6.00% 


69 

7 

20.00% 

BIN = Limite superior 

79 

18 

56.00% 

FREQUENCY = Frecuencia 

89 

12 

80.00% 

CUMULATIVE - Acumulado 

99 

8 

96.00% 


109 

2 

100.00% 
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B. Tablas de contingencia 

Las tablas de frecuencia pueden organizar datos de solo una variable a la vez. Si se desea examinar o comparar dos 
variables, una tabla de contingencia resulta de mucha utilidad. 

Se supone que ademas de recolectar information sobre el numero de pasajeros de P&P, tambien se obtuvieron 
datos sobre las edades de los pasajeros y el numero de vuelos en los que se registraron cada ano. Ambas 
variables pueden verse en detalle mediante una tabla de contingencia que enumera el numero de vuelos en la parte 
superior y las edades debajo, tal como se muestra en la tabla 2.6. A1 dividir la edad en cuatro categories y los 
vuelos en tres categories, se han creado 1 2 celdas en la tabla. Ahora se puede determinar si estas dos caracteristicas 
estan relacionadas. Por ejemplo, en la ultima columna se puede ver que el numero mas grande de pasajeros, 15 o 
30%, esta en la categoria de edad comprendida entre los 40 y los 65 anos y vuelan mas de cinco veces al ano. El 
numero mas pequeno de pasajeros, tan solo 4 personas, son menores de 25 anos o tienen 65 anos o mas. Una 
mayoria, 28 personas, toma de forma tipica mas de 5 vuelos cada ano. 


Tabla 2.6 

Tabla de contingencia 
para P&P Airlines 


Numero de vuelos por ano 


Edad 

1-2 

3-5 

Mayor de 5 

Total 

Menor de 25 

1 (0.02) 

1 (0.02) 

2 (0.04) 

4 (0.08) 

25-40 

2 (0.04) 

8(0.16) 

10(0.20) 

20 (0.40) 

40-65 

1 (0.02) 

6(0.12) 

1 5 (0.30) 

22 (0.44) 

65 y mas 

1 (0.02) 

2 (0.04) 

1 (0.02) 

4 (0.08) 

Total 

5(0.10) 

17(0.34) 

28 (0.56) 

50(1.00) 


Tambien se podria mostrar la informacion en cada celda segun el genero. De las 15 personas en el nivel de edad 
entre los 40 y los 65 anos, que vuelan mas de 5 veces al ano, ocho pueden ser hombres y siete mujeres. Entonces 
la entrada en dicha celda podria aparecer como 8,7 (0.30). Todas las otras caracteristicas relevantes de los pasajeros 
tambien podrian incorporate en la tabla. Es facil imaginar que dicho perfil descriptivo podria ser muy util en la 
identification del pasajero tfpico y en el establecimiento de politicas de marketing efectivas. 


Ejercicios de la seccion 


1. Un conjunto de datos contiene 100 observaciones; la mas grande es 315 y la mas pequena es 56. 

a. ^Cuantas clases deberia tener la tabla de frecuencias? 

b. ^Cual es el intervalo de clase? 

c. ^Cuales son los limites y puntos medios de cada clase? 

2. En un estudio reciente sobre 500 graduados en administration de negocios, el salario inicial mas alto que se 
reporto fue de $27,500 dolares y el mas bajo fue de $19,900 dolares. Usted desea crear la tabla de frecuencias 
para analizar y comparar estos datos con las ofertas de trabajo que usted ha recibido. 

a. ^Cuantas clases pondra en su tabla de frecuencia? 

b. ^Cual es el intervalo de clase? 

c. ^Cuales son los limites y puntos medios de cada clase? 

3. Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de Estados Unidos. Los 
datos estan expresados en miles de dolares. 
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58 

76 

89 

45 

67 

34 

64 

76 

34 

65 

45 

39 

79 

74 

56 

71 

85 

87 

74 

38 

69 

79 

61 

71 

69 

62 

56 

38 

69 

79 

71 

54 

31 

69 

62 

39 

65 

79 

47 

46 

77 

66 

55 

75 

62 

57 

77 

36 

73 

72 

64 

69 

51 

50 

40 

50 

74 

61 

69 

73 


a. Construya una tabla de frecuencia para los datos. Tenga mucho cuidado en la seleccion de sus intervalos 
de clase. Muestre las frecuencias acumulativas y relativas para cada clase. ^Que conclusion puede sacar 
de la tabla? 

b. Presente y explique una distribucion de frecuencia acumulada “mas que” y una distribucion de frecuencia 
acumulada “menor que”. 

4 . De los datos que se presentan a continuation, prepare una tabla de contingencia para evaluar a 45 empleados 
respecto a su nivel de educacion expresado en anos y el nivel administrative que poseen actualmente. Divida 
la educacidn en tres grupos: el grupo 1 entre los 10 y los 12 anos de educacion, el grupo 2 entre los 13 y los 
15 anos, y el grupo 3 para 16 anos y mas. ^Que patrones, si los hay, observa y a que conclusiones puede 
llegar? 


Nivel gerencial 

Anos de educacion 

Nivel gerencial 

Anos de educacion 

1 

14 

4 

16 

2 

13 

4 

18 

3 

16 

4 

14 

2 

16 

2 

15 

1 

12 

3 

17 

4 

16 

2 

12 

1 

12 

1 

12 

2 

12 

2 

15 

3 

14 

3 

16 

3 

14 

1 

10 

1 

13 

2 

14 

2 

12 

4 

16 

3 

20 

2 

14 

4 

17 

4 

16 

2 

14 

1 

10 

1 

13 

1 

12 

3 

16 

4 

13 

2 

11 

1 

10 

4 

16 

2 

13 

4 

16 

4 

17 

2 

10 

2 

15 

3 

11 

3 

14 

1 

14 




5 . Un proceso para production de materiales de construction esta disenado para generar contenedores de tres 
pesos diferentes: 10 libras, 1 1 libras y 12 libras. Un examen de 40 de los contenedores registra sus pesos reales 
y sus pesos deseados. Se considera que un contenedor es “defectuoso” si su peso real difiere en mas de 0.5 
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libras de su peso deseado. Realice una tabla de contingencia con estos datos en la cual indique cuantos 
contenedores, en cada uno de los tres grupos, estan dentro de la diferencia permisible. Registre las 
observaciones como “1” si es defectuoso y “2” si no es defectuoso. ^Puede detectar algun patron? ^Parece 
que un grupo de peso tiene una mayor proportion de defectos? 


Peso real 

Peso deseado 

Peso real 

Peso deseado 

9.5 

10 

12.3 

11 

9.6 

10 

10.4 

12 

12.1 

11 

12.1 

10 

11.2 

12 

10.0 

11 

11.6 

11 

11.2 

10 

12.3 

12 

9.9 

12 

9.6 

10 

9.6 

11 

10.6 

12 

12.4 

10 

11.0 

11 

11.2 

12 

11.2 

10 

11.6 

11 

9.8 

11 

12.3 

10 

10.5 

10 

9.6 

12 

11.9 

12 

10.6 

12 

11.0 

10 

11.2 

11 

9.8 

10 

10.5 

12 

11.9 

10 

12.3 

10 

10.4 

12 

12.1 

11 

10.0 

12 

11.2 

10 

9.9 

12 

9.6 

11 

11.5 

10 

9.5 

12 


2.3 Graficos 

Los gr&ficos tambien son metodos utiles para describir conjuntos de datos. Un histograma coloca las clases de 
una distribucion de frecuencia en el eje horizontal y las frecuencias en el eje vertical. La figura 2.1 muestra el 
histograma para la distribucion de frecuencias de la tabla 2.2. Revela detalles y patrones que no se pueden 
discemir facilmente de los datos originales. La frecuencia absoluta, asf como las frecuencias relativas de cada 
clase, estan ilustradas claramente. 

Figura 2.1 

Histograma 
para los 
pasajeros 
de P&P 


0 LJ 1 J 1 I I 1 

50 60 70 80 90 100 110 



Pasajeros 
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Parecido a un histograma, el diagrama de barras puede mostrar cantidades o porcentajes para dos o mas 
valores sobre el eje vertical. La figura ,2.2 demuestra los costos e ingresos para P&P Airlines. 


Figura 2.2 

Desempeno de P&P 



Anos 


Un diagrama circular es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. 
Se crea marcando una portion del cfrculo correspondiente a cada categona de la variable. La figura 2.3 muestra en 
porcentajes con que frecuencia los empleados llevan trabajo de la oficina a la casa. 


Figura 2.3 

Diagrama 

circular 


Con que frecuencia los trabaj adores llevan trabajo para hacer en la casa 



48% 


10% 


13% 

O VC 

Fuente: USA Today. 


12% 


Nunca 

Menos de una vez al mes 
Una vez al mes 
Dos veces a la semana 
3-4 veces a la semana 
Todos los dfas 


Los datos financieros con frecuencia estan contenidos en un grafico de maximos - minimus y al cierre. Como 
su nombre lo indica, muestra el valor mas alto, el valor mas bajo y el valor al cierre de los instrumentos financieros 
como por ejemplo las acciones. La figura 2.4 es un grafico basado en los datos tornados de The Wall Street 


Figura 2.4 

Grafico de maximos- 
minimos y cierre para 
15 acciones 
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o 
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181 

180 

179 


178 


9 


1 1 L_ 

10 11 12 

Dfa seleccionado en junio 



13 


Fuente: The Wall Street Journal. 
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Journal para el mdice Dow Jones respecto a 15 acciones durante un peiiodo de cinco dias con base en los 
siguientes datos: 



Maximos 

Mmimos 

Cierre 

Junio 9 

181.07 

178.17 

178.88 

10 

180.65 

178.28 

179.11 

11 

180.24 

178.17 

179.35 

12 

182.79 

179.82 

181.37 

13 

182.14 

179.53 

181.31 


Algunas veces se denominan maximos y mmimos al extremo superior de la recta vertical, o maximo, que marca 
el valor mas alto que alcanzo el mdice en ese dia; el extremo inferior indica el valor mas bajo que alcanzo ese dia. 
El valor de cierre se muestra mediante la linea pequena que se encuentra entre las dos anteriores. Podrian hacerse 
presentaciones similares para productos y monedas transadas en las bolsas organizadas del mundo. 

John Tukey, un estadistico notable, creo el diagrama de tallo y hoja como una altemativapara que el histograma 
proporcionara una impresion visual rapida sobre el numero de observaciones en cada clase. Cada observacion se 
divide en dos partes: un tallo y una hoja, separadas por una recta vertical. El diseno preciso puede adaptarse para 
que se ajuste a cualquier conjunto de datos, identificando un punto conveniente en el cual las observaciones 
puedan separarse de tal manera que formen un tallo y una hoja. Los valores fraccionarios tales como 34.5, 34.6, 
45.7, 45.8 y 56.2 pueden separarse en el punto decimal produciendo un tallo y una hoja de la siguiente manera: 


Tallo 

Hoja 

34 

5.6 

45 

7.8 

56 

2 


Vale la pena destacar que el tallo y la hoja estan colocados en series ordenadas. 

Si un tallo unico contiene un gran numero de observaciones en su hoja, es comun dividirlo en dos tallos 
independientes, exactamente en el punto medio. La pantalla 2.2 muestra un diagrama de tallo y hoja para nuestros 
datos sobre pasajeros, proporcionado por Minitab. La pantalla contiene tres columnas. La segunda y la tercera 
muestran el tallo y la hoja, respectivamente. Hay tres observaciones en los cincuentas: 50, 57 y 59. La primera 
columna muestra las profundidades, indicando la suma total de observaciones desde la parte superior de la 
distribution, para los valores menores que la mediana (lo cual se discutira mas adelante en este capftulo) o hasta 
la parte inferior de las distribuciones, para valores mayores que la mediana. La profundidad en parentesis, (9), 
muestra el numero de observaciones en el tallo que contiene la mediana. Por ejemplo, hay 19 observaciones desde 
50 hasta 74, y 22 observaciones desde 80 hasta la observacion maxima de 102. Se nota que hay dos tallos para los 
setentas separando las observaciones en el punto medio entre 74 y 75. 


Pantalla 2.2 

Stem-and-leaf display (Tallo y hoja para P&P) 


Character Stem-and-Leaf Display 
Stem-and-leaf of pass N = 50 

Leaf Unit = 1.0 

1 5:0 

3 5 : 79 

4 6:0 
567899 


Character Stem-and-Leaf Display = Visualizacion 

de caracteres 

Stem-and-leaf of pass = Tallo y hoja 

de pasajeros 

Leaf Unit = Unidad de hoja 


10 6 


Conti nua 
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19 7 : 001122344 

( 9 ) 7 : 567788999 

22 8 : 0012333444 

12 8 : 56 

10 9 : 012334 

4 9 : 57 

2 10 : 12 


La unidad de hoja expresa en donde colocar el punto decimal. Con la unidad de hoja = 1 .0, la primera observacion 
es 50. La unidad de hoja = 0.1 significaria que la primera observacion es 5.0 y la unidad de hoja = 10 significarfa que 
la primera observacion es 500. 


Ejercicios de la seccion 


6. Construya un diagrama de tallo y hoja sobre las tasas de desempleo en 15 pafses industrializados: 5.4%, 4.2%, 
4.7%, 5.5%, 3.2%, 4.6%, 5.5%, 6.9%, 6.7%, 3.7%, 4.7%, 6.8%, 6.2%, 3.6% y 4.8%. 

7. Desarrolle e interprete un histograma de la tabla de frecuencias que usted construyo para el ejercicio 3. 

8. Investor ’s Report (julio de 1 996) afirmo que el mes anterior la gente habia invertido, en millones de dolares, las 
siguientes cantidades, en tipos de fondos mutuos: 16.7 en fondos de desarrollo, 12.5 en fondos de ingreso, 
28.2 en fondos intemacionales, 15.9 en mercado monetario, y 13.9 en “otros”. Haga un diagrama circular que 
represente estos datos, complete con los porcentajes correspondientes. 

9. Los cambios del mes anterior para las inversiones hechas en cada uno de los fondos del problema anterior, 
fueron respectivamente, 2.3, 1 .5, -3.6, 4.5 y 2.9. Haga un diagrama de barras que refleje estos cambios. 


Problemas resueltos 

1. Una organization estudiantil esta por revisar el monto que los estudiantes invierten en textos cada semestre. 
Cincuenta estudiantes reportaron las siguientes cantidades, aproximadas al dolar mas proximo. 


US$125 

165 

148 

136 

179 

205 

209 

235 

265 

245 


US$157 

145 

168 

125 

191 

197 

205 

217 

148 

152 


US$113 

119 

117 

148 

225 

119 

221 

222 

165 

148 


US$127 

148 

105 

108 

204 

209 

178 

224 

228 

115 


US$201 

158 

136 

178 

104 

157 

247 

187 

239 

150 


a . Debido a que 2 C 3 50 produce seis clases, el intervalo para la distribution de frecuencias se encuentra como 
(mas alto - mas bajo / 6 = 265 - 104/6 = 26.8 . Por conveniencia se utiliza un intervalo de 25 . Esto resulta en 
realidad en siete clases en lugar de las seis propuestas. No hay problema. Si usted fija el limite inferior para 
la primera clase en 100 (de nuevo, por conveniencia usted podria utilizar 104), entonces la tabla sena: 



CAPITULO 2 * Descripeion de los conjuntos de datos 


Intervalo de clase 

Frecuencia 

M 

Frecuencia acumulada 

Frecuencia relativa 

100-124 

8 

112 

8 

0.16 

125-149 

11 

137 

19 

0.22 

150-174 

8 

162 

27 

0.16 

175-199 

6 

187 

33 

0.12 

200-224 

10 

212 

43 

0.20 

225-249 

6 

237 

49 

0.12 

250-274 

1 

262 

50 

0.02 


b. Las visualizaciones del histograma y del diagrama del tallo y hoja proporcionados por Minitab son: 


Histogram of Cl 

o 

LO 

II 

£ 


Histogram of Cl = Histograma de Cl 

Midpoint 

Count 


Midpoint = Punto medio 

112.0 

8 

******** 

Count = Conteo 

137.0 

11 

*********** 


162.0 

8 

******** 


187.0 

6 

****** 


212.0 

10 

********** 


237.0 

6 

****** 


262.0 

1 

* 



Stem- and- leaf of Cl N = 50 

Leaf Unit = 1.0 


3 

10 

458 

8 

11 

35799 

11 

12 

557 

13 

13 

66 

19 

14 

588888 

24 

15 

02778 

(3) 

16 

558 

23 

17 

889 

20 

18 

7 

19 

19 

17 

17 

20 

145599 

11 

21 

7 

10 

22 

12458 

5 

23 

59 

3 

24 

57 

1 

25 


1 

26 

5 


Stem-and-leaf of Cl = Tallo y hoja de Cl 
Leaf Unit = Unidad de hoja 


Las tres cantidades mas bajas son US$104, US$105, y US$108. Hay ocho estudiantes que pagaron entre 
US$104 y US$119. Esto corresponde a la frecuencia de la primera clase en la tabla anterior. La siguiente 
cantidad mas alta es US$125. La mediana esta en el tallo para US$160. 
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2. En una escala de 1 a 4, siendo 4 el mejor, un grupo de consumidores clasifica la “conciencia social” de 50 
organizaciones clasificadas como publicas (indicadas con un “1” en los siguientes datos), privadas (indicadas 
con un “2”), o controladas por el gobiemo (indicadas con un “3”). 


Tipo 

Clasificacion 

Tipo 

Clasificacion 

1 

1 

2 

2 

2 

2 

3 

3 

2 

3 

1 

1 

3 

2 

2 

4 

1 

4 

3 

4 

2 

2 

1 

2 

3 

3 

2 

3 

2 

2 

3 

2 

1 

1 

1 

1 

2 

2 

3 

4 

3 

3 

2 

2 

1 

4 

1 

3 

1 

2 

3 

1 

2 

3 

2 

4 

3 

1 

3 

2 

3 

2 

1 

1 

2 

3 

2 

3 

1 

2 

3 

2 

2 

1 

1 

1 

3 

4 

2 

4 

2 

4 

1 

1 

3 

1 

2 

2 

1 

2 

3 

3 

3 

4 

1 

2 

2 

1 

2 

1 


a. Prepare una tabla de contingencia completa con totales y porcentajes 

en columnas y filas. i,Que conclusiones 

puede sacar? Minitab produce la siguiente tabla. Observe que tan solo el 2 o el 4%, de las 15 organizaciones 

publicas recibieron una 

clasificacion de “4” 

. Exactamente dos veces el porcentaje de las organizaciones 

privadas y del gobiemo en la clasificacion mas alta. De las 50 organizaciones, 14% de las que recibieron un 

“1” eran unidades publicas. De las que recibieron un ‘T 

\ 53.85% eran publicas. Muchos otros hechos se 

hacen evidentes al examinar la tabla. 




ROWS : type 

COLUMNS : Rating 



ROWS: type = FILAS: tipo 







COLUMNS: Rating = COLUMNAS: 


1 

2 

3 

4 

ALL 

Clasificacion 

(Public) 1 






ALL = Todos 

7 

5 

1 

2 

15 

Public = Publicas 



46.67 

33.33 

6.67 

13.33 

100.00 

Private = Privadas 


53.85 

29.41 

10.00 

20.00 

30.00 



14.00 

10.00 

2.00 

4.00 

30.00 


(Private) 2 

3 

7 

5 

4 

19 



15.79 

36.84 

26.32 

21.05 

100.00 



23.08 

41.18 

50.00 

40.00 

38.00 



6.00 

14.00 

10.00 

8.00 

38.00 

Continua 
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(Government) 3 

3 

5 

4 

4 

16 

Government = 

Del gobierno 


18.75 

31.25 

25.00 

25.00 

100.00 

ALL = Todos 



23.08 

29.41 

40.00 

40.00 

32.00 

CELL CONTENTS 

= CONTENIDO 


6.00 

10.00 

8.00 

8.00 

32:00 


DE LAS 

CELDAS 

ALL 

13 

17 

10 

10 

50 




26.00 

34.00 

20.00 

20.00 

100.00 




100.00 

100.00 

100.00 

100.00 

100.00 




26.00 

34.00 

20.00 

20.00 

100.00 




CELL CONTENTS — 


COUNT 

COUNT 

= CONTEO 

% OF ROW 

% OF ROW 

= % DE FILA 

% OF COL. 

% OF COL. 

= % DE COLUMNA 

% OF TBL 

% OF TBL 

= % TOTAL 


Lista de formulas 


[ 2 . 1 ] 


2 C > n 


Determina el numero de clases en 
una tabla de frecuencias 


[ 2 . 2 ] 


1C 


Valor mas grande - valor mas pequeno 
Numero deseado de clases 


Intervalo de clase para una tabla 
de frecuencias 


Ejercicios del capitulo 

10. Bill Bissey, vicepresidente de Bank One en Indianapolis, controla la aprobacion de creditos para el desarrollo 
de negocios locales. Durante los ultimos cinco anos el credito mas grande fue de US$1.2 millones, y el mas 
pequeno fue de US$10,000. El desea crear una tabla de frecuencias con 10 clases. ^Cuales serfan los limites de 
las clases? ^Cual sena el intervalo de clase? 

11. El Sr. Bissey tambien guarda registros de las cuentas personales de ahorro. De las 40 nuevas cuentas abiertas 
el mes anterior, los saldos corrientes son: 


US$179.80 

US$890.00 

US$712.10 

US$415.00 

112.17 

1,200.00 

293.00 

602.02 

1,150.00 

1,482.00 

579.00 

1,312.52 

100.00 

695.15 

287.00 

1,175.00 

1,009.10 

952.51 

1,112.52 

783.00 

1,212.43 

510.52 

1 ,394.05 

1,390.00 

470.53 

783.00 

1,101.00 

666.66 

780.00 

793.10 

501.01 

1,555.10 

352.00 

937.01 

711.11 

1,422.03 

1,595.10 

217.00 

1,202.00 

1,273.01 
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Haga una tabla de frecuencias con siete clases. ^Esta trabajando con datos continuos o datos discretos? 
Explique. 

12. Utilizando los datos del ejercicio 11, realice e interprete una tabla de frecuencias relativa y una tabla de 
frecuencias acumulada. 

13. Utilizando los datos del ejercicio 11, construya un histograma. 

14. Utilizando los datos del ejercicio 1 1 , construya un diagrama de barras que muestre los porcentajes en cada clase. 

15 . Las perdidas y ganancias para las 50 firmas mas grandes (por concepto de ventas) en la lista de las 500 
mejores empresas de la re vista Fortune para el ano de 1992 aparecen a continuation en millones de dolares. 
El valor mas bajo es una perdida de US$4,453 millones (-4453), y el mas alto es una ganancia de US$5,600 
millones. Haga una tabla de frecuencias con el numero apropiado de clases. 


US$-4,453 USS-795 

US$423 

US$184 


US$97 

5,600 

1,567 

454 

258 


939 

-2,258 

1,773 

709 

535 


460 

-2,827 

1,484 

-578 

1,461 


-387 

2,636 

20 

368 

601 


-404 

1,920 

-1,021 

755 

-273 


63 

3,006 

1,080 

-732 

1,681 


308 

1,403 

17 

-617 

-142 


73 

1,294 

311 

1,154 

454 


97 

1,293 

942 

-1,086 

2,056 


505 

Como consultor economico privado, usted considera necesario leer fielmente The Wall Street Journal para 

estar al dia en su campo profesional. 

Un reporte reciente en 

The Wall Street Journal mostro los siguientes 

datos sobre el porcentaje de ejecutivos que estan 

en las 42 

mejores corporaciones de Estados Unidos que 

sufren de problemas de abuso de drogas. 





5.9 8.8 

14.3 

8.3 

9.1 

5.1 

15.3 

17.5 17.3 

15.0 

9.3 

9.9 

7.0 

16.7 

10.3 11.5 

17.0 

8.5 

7.2 

13.7 

16.3 

12.7 8.7 

6.5 

6.8 

13.4 

5.5 

15.2 

8.4 9.8 

7.3 

10.0 

11.0 

13.2 

16.3 

9.1 12.3 

8.5 

16.0 

10.2 

11.7 

14.2 


a. Construya un diagrama de tallo y hoja. 

b. Construya el histograma correspondiente 

c. Construya la distribucion de frecuencias y halle los puntos medios de clase. 
d Construya la distribucion de frecuencias relativa. 

17 . Los siguientes datos respecto a donde pasan las vacaciones los norteamericanos, se publicaron recientemente 
en Travel and Leisure : en ciudad 31%; en oceano 26%; en lago 5%; en montanas 10%; en parques estatales 
y nacionales 6%; en pequenas poblaciones rurales 22%. Como director de la junta de turismo de su estado, 
es su funcion presentar estos datos en un diagrama circular. 

18 . Big Al, el agiotista local, actualmente tiene 120 cuentas pendientes por cobrar. El contador de Big A1 le 
informa que de las 25 cuentas que estan en el intervalo comprendido entre US$0 a US$4,999, 10 estan 
vencidas, 5 atrasadas y el resto son morosas, colocando al deudor en peligro de ser visitado por el ejeeutor 
de Big Al. De las 37 cuentas comprendidas entre el intervalo de US$5,000 y US$9,999, 15 vencen, 10 ban 
vencido y el resto son morosas. Hay 39 cuentas en el intervalo comprendido entre US$10,000 y US$14,999 de 
las cuales 11 vencen, 10 han vencido y el resto son morosas. De las cuentas restantes que estan en el 
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intervalo comprendido entre US$15,000 y mas, 5 vencen, 7 han vencido y el resto son morosas. Big A1 desea 
ver una tabla de contingencia de estas cuentas. Interprete su significancia citando unas cuantas estadisticas 
que usted considere que sean las mas importantes y reveladoras. 

19 . Los promedios del fndice Dow Jones para 30 acciones industriales reportaron los siguientes valores en el mes 
de junio de 1997. Haga un diagrama de maximos-mmimos y cierre con base en estos datos. 



Maximos 

Mmimos 

Al cierre 

Junio 2 

6119.31 

6081.79 

6093.35 

3 

6123.58 

6084.82 

6101.71 

4 

6144.15 

6084.64 

6099.40 

5 

6148.12 

6111.13 

6124.47 


20 . Newsweek (agosto 26, 1996) reporto porcentajes de preferencia de varias drogas de los estudiantes de 
octavo grado que habfan utilizado drogas, y el porcentaje de uso de tales drogas cambio desde 1991. Utilice 
los datos sobre las tasas de 1996 sobre el uso de drogas para crear un diagrama circular y los cambios 
porcentuales para hacer un diagrama de barras. Comente los resultados. 


Droga de preferencia 

Tasa de uso en 1996 

Cambio en porcentajes desde 1991 

Crack 

2 . 70/0 

IO 80/0 

Herofna 

2.3 

92 

Marihuana 

19.5 

95 

Cocaina 

4.2 

83 

Cigarril los 

46.0 

5 

Alcohol 

25.3 

-5 


21 . Como proyecto de clase, un estudiante junior de mercadeo hizo una encuesta entre 20 negocios locales en 
Peoria, Illinois, respecto a su preferencia por un producto nuevo. Sus respuestas se registraron como un “1” 
si les gustaba el producto, un “2” si les disgustaba el producto, y un “3” si no opinaban. Los niveles de 
ventas anuales para las tiendas tambien se registraron asi 

1 Si las ventas fueron menores que US$50,000 

2 Si las ventas fueron de US$50,000 pero menores de US$100,000 

3 Si las ventas fueron de US$100,000 pero menores de US$200,000 

4 Si fueron de US$200,000 o mas 

Construya una tabla de contingencia con base en los datos mostrados. i A que conclusiones llega? 


Opinion Ventas Opinion Ventas 


1.00 

4.00 

3.00 

1.00 

1.00 

4.00 

2.00 

1.00 

3.00 

3.00 

3.00 

2.00 

1.00 

4.00 

3.00 

4.00 

3.00 

1.00 

1.00 

4.00 

3.00 

1.00 

1.00 

4.00 

3.00 

1.00 

1.00 

4.00 

1.00 

2.00 

3.00 

4.00 

2.00 

3.00 

2.00 

4.00 

1.00 

4.00 

3.00 

1.00 
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Ejercicio en computador 

Elizabeth Dunham es la directora ejecutiva de operaciones del personal para Minor Maturity Fashions, una 
fabrica de ropa cuyo objetivo es la mujer joven. Ella ha recolectado datos sobre las ventas semanales en cientos 
de dolares durante las 100 ultimas semanas y sobre los costos de nomina en miles de dolares para el mismo 
perfodo. Sin embargo, la senorita Dunham esta algo sorprendida por la cantidad de numeros que tiene a su 
disposition y necesita ayuda para organizar estos datos en una forma significativa. Ella debe sacar alguna 
impresion sobre la naturaleza de las ventas y los costos de nomina de manera que pueda obtenerse la information 
importante para la proxima reunion de junta directiva. Tambien necesita algun consejo sobre cuales caracterfsticas 
de estas variables importantes son las mas significativas. 

Ingrese al archivo MINOR y proporcione a la senorita Dunham todas las distribuciones de frecuencia relevantes 
y graficos que su software pueda generar. Usted puede tener que crear a mano algunas de dichas herramientas 
descriptivas si su software no es lo suficientemente flexible. Prepare un reporte estadistico como el que aparece 
en el apendice I. Incluya todas las partes importantes del reporte estadistico incluyendo el resumen ejecutivo y 
sus conclusiones y recomendaciones. 



PU 

ESTA 

EN E 

ESCENA 








En el caso presentado al inicio del capftulo usted debia 
describir y caracterizar los datos que recolecto sobre la 
tarifas de alquiler de autos para sus tan esperadas vacaciones 
de primavera. Con base en esos datos sobre los costos 
diarios del alquiler provenientes de varias compamas en 
cada ciudad, prepare un reporte detallado describiendo sus 
descubrimientos. Incluya tantas herramientas de las que se 
trataron en este capitulo como le sea posible. Proporcione 

graficos que muestren los costos promedios para cada 
ciudad como un porcentaje del costo promedio de todas 
las ciudades. 

Haga una tabla de contingency que muestre cada una 
de las ciudades que aparecen en las columnas. Agrupe los 
datos sobre tarifas en 3 a 5 grupos para las filas. Incluya 
los porcentajes de la columna y de la flla y los totales, asi 
como se hizo en el problema resuelto numero 2. 

Ciudad 

Tarifa 

Ciudad 

Tarifa 

Ciudad 

Tarifa 

Miami 

85 

Houston 

58 

San Diego 

89 

Houston 

68 

Phoenix 

65 

New Orleans 

79 

New Orleans 

65 

Houston 

63 

Miami 

62 

Miami 

50 

Phoenix 

52 

New Orleans 

96 

Miami 

102 

Houston 

87 

Miami 

98 

New Orleans 

84 

Houston 

69 

New Orleans 

87 

Miami 

110 

Miami 

85 

Houston 

69 

Phoenix 

85 

Phoenix 

64 

New Orleans 

81 

Houston 

95 

New Orleans 

97 

Houston 

62 

Phoenix 

58 

Phoenix 

69 

Phoenix 

59 

Houston 

59 

New Orleans 

74 

Houston 

63 

Phoenix 

51 

Phoenix 

87 

New Orleans 

62 

New Orleans 

76 

Houston 

67 

New Orleans 

52 

i 




f Del escenario a la vida real 

En internet se pueden visitar varias companias de alquiler de autos y “Gufas para compradores” para comparar los 
precios de alquiler y hacer reservaciones. La siguiente es una selection de tales sitios: 

Servicios de compras : 

Breeze Net’s Guide to Airport Cars www. bmn . com 
Car Rental Shopper’s guide www.rent-cars.com 
Companias nacionales de alquiler de autos: 


Alamo 

www. goa lamo. com 

Avis 

www.avis.com 

Budget 

www.budgetrentacar. com 

Hertz 

www.hertz.com 

Thrifty 

www. thrifty, com 


Utilizando la information sobre precios reales obtenida de estos sitios en internet, elabore nuevamente la tabla de 
contingencia que elaboro en el ejercicio de Puesta en Escena . ^Cuales de las ciudades de Miami, Houston, 
Phoenix, o New Orleans tiene el numero mas grande de companias de alquiler de autos? ^Cual ofrece el rango de 
precios mas amplio? 
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E S C E N A R I 0 

La revista Fortune (febrero 17 de 1997), reporto el 
rendimiento promedio anual de tres fondos (fondos de 
riesgo, de tftulos y de desarrollo) que ofrecfa Janus Funds, 
una gran compania de fondos mutuos de inversion. Como 
analista de inversiones se le asigna la tarea de analizar las 
operaciones de Janus. Para efectuar esta asignacion laboral 
se debe preparar un estudio descriptivo del desempeno de 
los tres fondos que aparecen en el grafico. 

Como lo demuestra el grafico, los rendimientos en cada 
uno de estos fondos han variado considerablemente con los 
anos. Hay muchas consideraciones que se deben tener en 
cuenta al realizar el analisis, y el supervisor inmediato ha 
enfatizado la importancia de una presentation minuciosa y 
precisa. 


Surgen muchas preguntas sobre la forma como se debe 
proceder. Como lo ensena este capftulo, existen muchas 
herramientas descriptivas del analisis estadfstico que se 
pueden utilizar para desarrollar el analisis. Cada herramienta 
juega un papel importante en el suministro de valiosa 
informacion. Los estadfsticos descriptivos tales como 
rendimientos promedio y medidas de dispersion, seran 
muy utiles. 

En este capftulo se analizar&n muchas de las 
herramientas descriptivas que se utilizan usualmente para 
transmitir informacion valiosa de manera concisa e 
informativa. Tales practicas reducen la incertidumbre y 
facilitan ampliamente el proceso de toma de decisiones. 



Rendimientos porcentuales - Janus Funds 


30 

25 

20 



1994 1995 1996 


□ Fondos de riesgo 
IB Fondos de ingreso 
H Fondos de desarrollo 


3.1 Introduction 

Los datos, al igual que los estudiantes, se congregan alrededor de sus puntos de encuentro favoritos. Parece que 
los estudiantes acuden en masa a sitios tales como partidos de futbol, fratemidades, bares populares y otros 
sitios de reunion y en raras ocasiones hasta la biblioteca. De igual forma, los numeros parecen disfrutar de la 
compania de otros numeros y estan propensos a reunirse alrededor de un punto central denominado medida de la 
tendencia central o, mas comunmente, media. Una medida de tendencia central ubica e identifica el punto 
alrededor del cual se centran los datos. 
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Un conjunto grande de datos puede ser rapidamente descrito de manera sucinta con un solo numero. Si el 
profesor dice que el promedio de la clase en el ultimo examen de estadistica fue de 95, esto indica algo. Si se dice 
que el promedio fue de 35, esto indica algo totalmente diferente. 

Ademas, las medidas de dispersion indican el punto hasta el cual las observaciones individuales se esparcen 
alrededor de su punto central. Miden la dispersion o la variabilidad de los datos y reflejan la tendencia de las 
observaciones individuales a desviarse de dicho punto central. 

3.2 Medidas de la tendencia central a partir de datos no 
agrupados 

Existen tres metodos comunes para identificar el centro de un conjunto de datos: la media, la mediana y la moda. 
Su calculo e interpretacion dependera de la definicion de “centro”. En cada caso, se ubican en el punto alrededor 
del cual se aglomeran los datos. 


A. La media 

La media, o media aritmetica, es la medida de la tendencia central que usualmente se le llamaba promedio. Por 
ejemplo, para calcular la media de los ultimos 10 examenes de estadistica, simplemente se suman y se divide por 10. 

Media aritmetica La medida de la tendencia central que normalmente era considerada 
como el promedio. 


La media de una poblacion es el parametro jx (que se pronuncia miu). Si hay N observaciones en el conjunto de 
datos de la poblacion, la media se calcula asf: 



La letra griega mayuscula 2 es el signo de sumatoria que indica que se suman todas las observaciones de 1 a N. 
LasX. denotan las observaciones individuales. En aras de la simplicidad, el subindice y el supenndice se reduciran 
y aparecera el signo de la sumatoria como simplemente E. 


La media de una muestra es un estadistico X (que se lee X — barra). Con n observaciones en el conjunto de 
datos de la muestra, la media se determina asi: 



Se supone que una muestra de los ingresos por ventas mensuales en miles de dolares para cinco meses es de 
56, 67, 52, 45, y 67. La media se calcula asf: 


- 56 + 67 + 52 + 45 + 67 

* 5 " 574 
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B. La mediana 

La mediana algunas veces es llamada media positional, porque queda exactamente en la mi tad del conjunto de 
datos despues de que las observaciones se han colocado en serie ordenada. La mitad de las observaciones estara 
por encima de la mediana, la otra mitad estara por debajo de ella. 


La mediana La observation de la mitad despues de que se han colocado los datos en 
una serie ordenada. 


Si el conjunto de datos tiene un numero impar de observaciones, la position de la mediana es 


Posicion de la mediana = + * 

[3.3] 

2 



Dado el ejemplo anterior sobre los ingresos por ventas, se debe colocar primero los datos en serie ordenada: 


45,52, 56,67,67 

La posicion del valor de la mediana se vuelve 

Posicion de la mediana = = 3 

2 

o la tercera posicion. De la serie ordenada anterior se puede observar que este valor es 56. 

Con un conjunto de datos que contiene un numero par de observaciones es necesario promediar los dos 
valores medios. Si los ingresos para un sexto mes son de 35 y se adiciona al conjunto de datos, entonces la serie 
ordenada se vuelve 35, 45, 52, 56, 67, 67. La posicion de la mediana es 

Posicion de la mediana = — = 35 

2 

es decir, la posicion tres y medio. Los dos valores de las posiciones tercera y cuarta se promedian para producir 
una mediana de 52 + 56 = 54. Esto significa que en la mitad de los meses las ventas estuvieron por debajo de 
US$54,000, y en la mitad de los meses los ingresos excedieron dicha suma. 


C. La moda 

La observaeion modal es la observaeion que ocurre con mayor frecuencia. Utilizando las seis observaciones 
anteriores de 35, 45, 52, 56, 67, 67, la moda es 67. Si la septima observaeion de 56 se agregara, el conjunto de datos 
serfa bimodal , con modas de 56 y 67. 


Ejemplo 3.1 Medidas de tendencia central 

La emision de la revista Fortune del 17 de febrero ae 1997 reporto que en 1996 las utilidades en 
millones de dolares de varias de las 500 mejores compamas que aparecen en la revista incluian: 

Exxon US$7,510 General Electric US$7,280 

Philip Morris 6,246 IBM 5,429 

Intel 5,157 General Motors 4,289 
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Calcule las tres medidas de tendencia central. 


Solucion 

Media: Tratando los datos como una muestra se tiene que 

^ 7,510 + 7,280 + 6,246 + 5,429 + 5,157 + 4,289 

* = ’ = 5,985 

o 

Mediana: Primero deben colocarse los datos en una serie ordenada. Si no estan ordenados, la 
posicion que se encuentre utilizando la formula 3.3 no tiene sentido. 

4,289, 5,157, 5,429, 6,246, 7,280, 7,510 

La posicion de la mediana es (n + l)/2 = 3.5. La mediana es el promedio de los valores tercero y 
cuarto: 5,429 + 6,246 = 5,837.5 

Moda: Este conjunto de datos no tiene moda debido a que todas las observaciones ocurrieron con 
igual frecuencia. 

Interpretacion 

La media y la mediana identifican el centro del conjunto de datos alrededor del cual se encuentran 
las observaciones. 


D. La media ponderada 

En la discusion sobre la media, se asume que cada observacion era de igual importancia. Sin embargo, en ciertos 
casos, puede querer darse mayor peso a algunas de las observaciones. Por ejemplo, si el profesor de estadistica 
amenaza que el examen final valdra el doble de los otros examenes para determinar la nota final, entonces al 
puntaje que se obtenga en el examen final debe darsele el doble de peso. Es decir, que debe contarse doble al 
calcular la nota. Esto es exactamente lo que hace la media ponderada al utilizar la formula 3.4 


y . SMy 
w zw 


en donde X w es la media ponderada 

X es la observacion individual 

W es el peso o ponderacion asignada a cada observacion. 

Se asume que se obtuvo un puntaje de 89, 92 y 79 en los examenes parciales y 94 en el examen final. Estos puntajes 
y sus respectivas ponderaciones estan reflejados en la tabla 3.1 La formula (3.4) da 


[3.4] 


X 


w 


2XW _ 448 
2W ~~ 5 


89.6 


Tabla 3.1 

Nota (X) 

Peso [WJ 

XW 

Calculo de la media 

89 

1 

89 

ponderada 

92 

1 

92 


79 

1 

79 


94 

2 

188 



5 

448 
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Este metodo es igual que sumar la nota del examen final dos veces al calcular la media: 

- 89 + 92 + 79 + 94 + 94 

X* = = 89.6 


Media ponderada La media ponderada toma en cuenta la importancia relativa de las 
observaciones. 


Ejemplo 3.2 Calculo de la media ponderada 

Paul el fontanero vende cinco tipos de limpiadores para desagties. En la tabla se muestra cada tipo 
junto con la utilidad por lata y el numero de latas vendidas. 


Limpiador 

Utilidad por lata (X) 

Volumen de ventas en latas [W] 

XW 

Glunk Out 

US$ 2.00 

3 

US$ 6.00 

Bubble Up 

3.50 

7 

24.50 

Dream Drain 

5.00 

15 

75.00 

Clear More 

7.50 

12 

90.00 

Main Drain 

6.00 

15 

90.00 


US$ 24.00 

52 

US$ 285.50 


Se puede calcular la media aritmetica simple de la utilidad de Paul como US$24/5 = US$4.80 por 
lata. 


Solucion 

Sin embargo, probablemente este no sea un buen estimado de la utilidad promedio de Paul, debido 
a que vende mas de algunos tipos de limpiadores que de otros. Para obtener un estado financiero 
mas representativo del desempeno real de su negocio, Paul debe dar mas peso a los tipos mas 
populares de limpiadores. Por tanto, el calculo apropiado serfa la media ponderada. La medida de 
peso apropiada serfa las cantidades vendidas. La media ponderada es entonces 


2XW US$285.50 


= US$5.49 


Interpretation ^ 52 

La media ponderada es mayor que la media aritmetica simple porque Paul vende mas limpiadesagiies 
de los tipos que tienen un margen de utilidad mayor. 


E. La media geometrica 

La media geometrica puede utilizarse para mostrar los cambios porcentuales en una serie de numeros positivos. 
Como tal, tiene una amplia aplicacion en los negocios y en la economia, debido a que con frecuencia se esta 
interesado en establecer el cambio porcentual en las ventas, en el producto nacional bruto o en cualquier serie 
economica. 


Media geometrica La media geometrica proporciona una medida precisa de un 
cambio porcentual promedio en una serie de numeros. 
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La media geometrica (MG) se halla tomando la raiz enesima del producto de n numeros. Asi, 


MG= </X x X 2 X y - --X n [3.5] 


La mayona de las calculadoras manuales pueden calcular la rafz enesima de cualquier numero. 

La media geometrica se utiliza con mas frecuencia para calcular la tasa de crecimiento porcentual promedio de 
algunas series dadas, a traves del tiempo. Para ilustrar esta aplicacion en un escenario de negocios, se consideran 
las cifras sobre ingresos del ejemplo 3.3 para White-Knuckle Airlines, la principal competencia de P&P durante los 
ultimos cinco anos. 


Ejemplo 3.3 La media geometrica 

El CEO (director ejecutivo) de White-Knuckle Airlines desea determinar la tasa de crecimiento 
promedio en los ingresos con base en las cifras dadas en la tabla. Si la tasa de crecimiento promedio 
es menor que el promedio industrial del 10%, se asumira una nueva campana publicitaria. 


Ingresos para White-Knuckle Airlines 

Ano 

Ingreso 

Porcentaje del ano anterior 

1992 

US$ 50.000 

— 

1993 

55,000 

55/50 =1.10 

1994 

66,000 

66/55 = 1 .20 

1995 

60,000 

60/66 = 0.91 

1996 

78,000 

78/60 = 1 .30 


Solution 

Primero es necesario determinar el porcentaje que los ingresos de cada ano representan respecto de 
los obtenidos el ano anterior. En otras palabras, ^que porcentaje del ingreso de 1992 es el ingreso en 
1993? Esto se encuentra dividiendo los ingresos de 1992 entre los de 1993. Elresultado, l.lOrevela 
que los ingresos de 1993 son 110% de los ingresos de 1992. Tambien se calculan los porcentajes 
para los tres anos restantes. Tomando la Media Geometrica (MG) de estos porcentajes da 

MG= ^(1.10X1.2X0.91X1.3) = 1.1179 

Restando 1 para convertirlo a un incremento anual promedio da 0. 1 179, o un incremento promedio 
de 1 1.79% para el perfodo de cinco anos. 

Por otro lado, la media aritmetica simple es 

- 1.1 + 1.2 + 0.91 + 1.3 4.51 

x = = — — = 1.1275 

4 4 

o un cambio promedio de 12.75%. Se divide por 4 ya que se presentaron cuatro cambios durante el 
perfodo de cinco anos. 

Sin embargo, si un incremento promedio de 12.75%, basado en la media aritmetica simple, se 
aplica a la serie que comienza con US$50,000, los resultados son 

US$ 50,000 X 1.1275 = US$ 56,375 
US$ 56,375 X 1 . 1275 = US$ 63,563 
US$ 63,563 X 1 . 1 275 = US$ 7 1 ,667 
US$ 7 1 ,667 X 1 . 1 275 = US$ 80,805 
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Ya que US$80,805 excede los US$78,000 que White-Knuckle Airlines en realidad gano, el 
incremento del 12.75% es obviamente muy alto. Si se utiliza la tasa de crecimiento de la media 
geometrica del 1 1 .79%, se obtiene 

US$50,000x 1.1 179= US$55, 895 
US$55,895 X 1 . 1 1 79 = US$ 62,485 
US$62,485 X 1.1 179 = US$69,852 
US$ 69,852 X 1.1 179 = US$ 78,088 - US$78,000 
Esto da un valor de US$78,088, lo que esta mucho mas cerca al ingreso real de US$78,000. 


Interpretation 

La media geometrica representa el cambio promedio con el tiempo. Debido a que la tasa de crecimiento 
supera el promedio de la industria del 10%, la nueva campana publicitaria no se llevara a cabo. 


La media geometrica siempre sera menor que la media aritmetica salvo en el extrano caso en el que todos los 
incrementos porcentuales sean iguales. Entonces las dos medias seran iguales. 


3.3 Comparacion entre media, mediana y moda 

La media es la medida mas comun de tendencia central. Se presta para mayor manipulation e interpretation 
algebraica. Desafortunadamente, la media se ve afectada por valores extremos, o valores atipicos, y a diferencia de 
la mediana, puede ser sesgada por las observaciones que estan muy por encima o muy por debajo de esta. 

Por ejemplo, para los datos 4, 5, 6, 6,7, 8 la media y la mediana son ambas 6 y representa una excelente medida 
del punto central de los datos. Si la ultima observation fuera 80 en lugar de 8, la media serfa 18, pero la mediana 
todavia sena 6. Debido a que la mediana no se ve afectada por este valor extremo, representa mejor las seis 
observaciones. 

La moda tambien es menos afectada por unas pocas observaciones atfpicas y sigue siendo 6 aun cuando el 
ultimo valor sea 80. Sin embargo, si no hay moda, o si el conjunto de datos es bimodal, su uso puede ser confuso. 

Esto no implica que una medida sea necesariamente mejor que las otras. La medida que se seleccione depende 
de la naturaleza de los datos o de la forma como se utilicen los datos. Por ejemplo Land’s End un vendedor 
minorista popular de equipos para acampar, se beneficiana muy poco del hecho de saber que la talla promedio de 
las botas de excursionismo que vendio fue de 7.3492. De mayor utilidad para las decisiones futuras del negocio 
seria conocer el tamano modal - reconociendo que vendio mas botas de talla 8 que de cualquier otra talla. 

Sin embargo, se asume que Land’s End desea comercializar una nueva tienda de acampar. Las dimensiones de 
la tienda dependeran, entre otras cosas, de la estatura promedio de los adultos. La experiencia ha demostrado que 
la media sirve muy bien como medida de tendencia central cuando se trata de productos que estan hechos para 
acomodarse a la estatura de las personas. El tamano de los marcos de las puertas de las entradas de los hogares 
y negocios minoristas, y gran parte del mobiliario se fabrica con base en la estatura promedio. 


Ejercicios de la seccion 


1. Su firma esta introduciendo un nuevo chip de computador del cual se promociona que realiza calculos 
estadfsticos mucho mas rapidamente que los que actualmente se encuentran en el mercado. Se hacen veinte 
calculos diferentes, produciendo los tiempos en segundos que se ven mas adelante. Aunque usted no puede 
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tergiversar su producto, usted desea presentar los resultados de la manera mas favorable para su empresa. 
Determine la media, la mediana y la moda. Comente los beneficios relativos de utilizar cada estadistico. 


3.2 

4.1 

6.3 

1.9 

0.6 

5.4 

5.2 

3.2 

4.9 

6.2 

1.8 

1.7 

3.6 

1.5 

2.6 

4.3 

6.1 

2.4 

2.2 

3.3 


2 . Como gerente de ventas de Acme, Inc., usted desea calcular las medidas de tendencia central para los niveles 
de utilidad de su firma, durante los ultimos doce meses, ya que las siguientes utilidades mensuales estan 
dadas en miles de dolares: 


US$12.3 

US$14.3 

US$25.7 

21.6 

21.6 

-12.8 

22.3 

18.0 

23.1 

-3.4 

17.9 

22.3 


3 . El director de la planta de Intel desea que usted compare los salarios promedio en su planta de Palo Alto con las 
de la competencia que queda ubicada en las cercamas de San Jose. De los 6,012 empleados que supervisa 1,212 
ganan US$12.30 la hora; a 650 se lespaga US$15.50; 3,098 ganan US$23.50, y alresto se les paga US$17.12. De 
los 5,634 empleados que hay en la otra planta 1,654 ganan US$12.75; 815 reciben US$17.80 y los otros US$20.10. 
Escriba un breve informe para que el director obtenga detalladamente la information que desea. 

4 . Una empresa grande de equipos deportivos esta probando el efecto de dos planes publicitarios sobre las 
ventas de los ultimos 4 meses. Dadas las ventas que se ven aqui, ^cual programa de publicidad parece 
producir el crecimiento promedio mas alto en ventas mensuales? 


Mes 

Plan 1 

Plan 2 

Enero 

US$ 1,657 

US$ 4,735 

Febrero 

1,998 

5,012 

Marzo 

2,267 

5,479 

Abril 

3,432 

5,589 


3.4 Medidas de dispersion 

En nuestro esfuerzo por describir un conjunto de numeros hemos visto que es de utilidad ubicar el centro del 
conjunto de datos. Pero identificar una medida de tendencia central rara vez es suficiente. Una description mas 
completa del conjunto de datos puede obtenerse si se mide que tan dispersos estan los datos alrededor de dicho 
punto central. Esto es precisamente lo que hacen las medidas de dispersion. Indican cuanto se desvian las 
observaciones alrededor de su media. 


Medidas de dispersion Miden que tanto se dispersan las observaciones alrededor de 
su media. 


Se toman por ejemplo los tres conjuntos pequenos de datos que se observan aqui. 


Conjunto de datos 1 

Conjunto de datos 2 

Conjunto de datos 3 

0,5,10 

4,5,6 

5,5,5 
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Los tres tienen una media de cinco. ^Se debe por tanto concluir que los conjuntos de datos son similares? 
Claro que no. Sin embargo, si se informa solo sus medias, sin ver las observaciones, se puede concluir que hay 
similitud. Una imprecision mas notoria de los conjuntos de datos resultarfa si se compara el grado en el cual se 
dispersaron las observaciones individuates en cada conjunto de datos o se expandieron alrededor de la media 
cinco. Las observaciones en el primer conjunto de datos estan muy dispersas por encima y por debajo de la media, 
mientras que aquellas del segundo grupo de datos estan comparativamente cerca de esta. El primer conjunto de 
datos tiene una medida de dispersion mayor que la segunda. El tercer conjunto de datos no tiene dispersion, 
todas las observaciones son iguales a la media. Sabiendo esto, serfa poco probable asumir de manera erronea 
cualquier similitud en los conjuntos de datos simplemente con base en su media. En este sentido, las medidas de 
dispersion son muy utiles e informativas. 


A. El rango 

La medida de dispersion mas simple (y menos util) es el rango o recorrido. El rango es simplemente la diferencia 
entre la observacion mas alta y la mas baja. Su ventaja es que es facil de calcular. Su desventaja es que considera 
solo dos de los cientos de observaciones que hay en un conjunto de datos. El resto de las observaciones se 
ignoran. Los rangos de los tres conjuntos de datos anteriores son 10, 2 y 0 respectivamente. 


B. Varianza y desviacion estandar de una poblacion 

La varianza y su raiz cuadrada, y la desviacion estandar son medidas de dispersion mucho mas utiles. Proporcionan 
una medida mas significativa sobre el punto hasta el cual se dispersan las observaciones alrededor de su media. 

La varianza es el “promedio de las desviaciones respecto a su media elevadas al cuadrado”. i Que significa 
esto? Significa que (1) se encuentra la cantidad por la cual cada observacion se desvia de la media, (2) se elevan 
al cuadrado tales desviaciones, y (3) se halla la media de tales desviaciones elevadas al cuadrado. Asi, se tiene el 
promedio de las desviaciones de la media elevadas al cuadrado. 


Varianza El promedio de las observaciones respecto a su media elevadas al cuadrado. 

La varianza para una poblacion cr 2 (se tee sigma al cuadrado) es 


Varianza 0-2 

_ - /la) 2 + ( X 2 - /x) 2 + (X 3 - n) 2 + • • - + (X„ - /x) 2 


N 

[3.6] 

poblacional 

_ 2(X, - At) 2 

N 

Endonde X l ,X 2 ,X 3 ,...,X N 

son las observaciones individuates 


V 

es la media poblacional 


N 

es el numero de observaciones 


La desviacion estandar a es 

Desviacion 
estandar poblacional 

0* = 

[3.7] 
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Vale la pena notar que debido a que se esta trabajando con una poblacion, la media es fx, no X , como para una 
muestra, y el numero de observaciones es 7/ y no n, como para una muestra. 


■ — — - — — — - — — — * — 

ff§ Desviacion estandar Es la raiz cuadrada de la varianza. Es una medida importante de 
1 1 M dispersion de los datos. 

aiLi ; 1 ' - 


A manera de ilustracion, Chuckie Chambers vende cinco polizas de seguro diferentes del baul de su Plymouth 
modelo 1973. Sus respectivas primas mensuales son de US$1 10, US$145, US$125, US$95 y US$150. La prima 
promedio es 

110 + 145 + 125 + 95 + 150 

M = — — = US$125 

La varianza se halla: (1) restando la media de US$125 de cada una de las observaciones, (2) elevando al 
cuadrado estas desviaciones, y (3) hallando el promedio de estas desviaciones al cuadrado. Al seguir estos tres 
pasos resulta: 

_ (HO ~ 12 5) 2 + (145 - 125) ; 4- (125 - 125) 2 + (95 - 125) 2 + (150 - 125) 2 

5 ~~~~ 


= 430 


A pesar del uso comun de la varianza, esta presenta dos problemas: es un numero muy grande con respecto 
a las observaciones. Como se puede ver, es varias veces mayor incluso que la observacion mas grande. Debido 
a su gran tamano, con frecuencia la varianza se vuelve dificil para trabajar. 

Un problema aun mas angustioso es que debido a que las desviaciones son elevadas al cuadrado, la varianza 
siempre se expresa en terminos de los datos originales elevados al cuadrado. En el caso de Chuckie, debido a que 
elevo al cuadrado las desviaciones de la media, entonces se convierte en 430 dolares al cuadrado - una unidad de 
medida que no tiene sentido. En la mayorfa de los casos la varianza se expresa en terminos que no tienen 
significado o interpretation logica. 

Sin embargo, ambas complicaciones pueden resolverse rapidamente. Tan solo con hallar la desviacion estandar 
<7, sacando la raiz cuadrada de la varianza: 

a - V430 - US$20.74 

Asi de facil, se solucionan ambos problemas. Ahora se tiene un numero mas pequeno con el cual es mas facil 
trabajar, y mas importante aun, ahora esta expresado en dolares ya que se tomo la raiz cuadrada de los dolares 
elevados al cuadrado. 

El concepto de desviacion estandar es muy importante en los negocios y en la economia. Por ejemplo, en 
fmanzas la desviacion estandar se utiliza como medida de riesgo relacionada con varias oportunidades de inversion. 
Mediante el uso de la desviacion estandar para medir la variabilidad en las tasas de rendimiento ofrecidas por 
diferentes inversiones, el analista financiero puede medir e] nivel de riesgo que tiene cada activo financiero. 
Generalmente, entre mayor sea la desviacion estandar de la tasa de rendimiento de una inversion en particular, 
mayor sera el grado de riesgo. Veamos el siguiente ejemplo: 


Ejemplo 3.4 Varianza y desviacion estandar de una poblacion 

Markus Boggs es gerente de Nest Egg Investments. Recientemente, Markus estaba interesado en 
las tasas de rendimiento de los ultimos cinco anos de dos diferentes fondos mutuos. Megabucks, 
Inc. mostro, durante unperiodode cinco anos, tasas de rendimiento del 12, 10, 13, 9y ll%,mientras 
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que Dynamics Corporation arrojo 13, 12, 14, 10 y 6%. Un cliente se acerco a Boggs y expreso su 
interes en uno de estos fondos mutuos. ^Cual deberfa escoger Boggs para su cliente? 

Solucion 

Vale la pena destacar que ambos fondos ofrecen un rendimiento promedio del 11%. Debido a que 
ambos ofrecen el mismo rendimiento en promedio, una inversion mas segura es la que tiene un 
grado menor de riesgo, tal como se midio mediante la desviacion estandar. Para Megabucks, Boggs 
halla 


0-2 = (12 - ll) 2 + (10 - ll) 2 + (13 - ll) 2 + (9 - ll) 2 + (11 -- ll) 2 
^ 5 

La desviacion estandar es 


cr = V2 = 1.41% 


Para Dynamics, 

2 _ (13 - ll) 2 + (12 - ll) 2 + (14 - ll) 2 4- (10 - ll) 2 + (6 - ll) 2 
a 5 

La desviacion estandar por tanto es 


cr = V8 = 2.83% 

Interpretation 

Debido a que Megabucks presenta menos variabilidad en sus rendimientos y ofrece la misma tasa 
de rendimiento promedio que ofrece Dynamics, Megabucks representa la mas segura de las dos 
inversiones y por ende es la oportunidad de inversion preferida. 


C. Varianza y desviacion estandar para una muestra 

Tome nota : Los ejemplos anteriores se relacionan con la varianza y la desviacion estandar para una poblacidn. 
Los simbolos a 2 y crson letras griegas tipicas de los parametros. 

Rara vez se pueden calcular parametros. En la mayorfa de los casos mas bien se estimaran tomando una 
muestra y calculando los estadfsticos correspondientes. Teniendo esto presente, esta seccion analiza la forma 
como se calculan estas importantes medidas de dispersion en la medida en que se relacionan con las muestras. 

La varianza y la desviacion estandar para una muestra representan medidas de dispersion alrededor de la 
media. Se calculan de manera parecida a aquellas para una poblacion. La varianza de la muestra s 2 es 


Varianza 
de la muestra 

2 _ 1(X, - x) 2 

s n - 1 

[3.8] 

y la desviacion estandar de la muestra es 

Desviacion estandar 
de la muestra 

s = V? 

[3.9] 
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Vale la pena destacar que la media en la formula (3.8) se expresa como X, y no jll, ya que se esta trabajando con 
muestras. Ademas, se divide por n- 1 en lugar de N , debido a que se tiene n- 1 grados de liber tad, gl~n-\.E\ 
numero de grados de libertad en toda operation estadistica es igual al numero de observaciones menos toda 
restriccidn impuesta en tales observaciones. Una restriccion es cualquier valor que deba calcularse de dichas 
observaciones. 

Por ejemplo, se asume que se deben seleccionar n = 4 observaciones que deben promediar X = 10. Bajo estas 
condiciones, se esta en libertad de escoger tres numeros que se deseen - digamos el tamano del sombrero, la edad 
o el coeficiente intelectual-CL Aunque una vez que esos tres numeros se seleccionan, el cuarto esta predeterminado 
si los anteriores deben promediar X = 10. Como lo ilustra la formula (3.8), la varianza utiliza el valor para X que 
fimciona como una restriccion y por tanto reduce los grados de libertad en 1. Por consiguiente, se disminuye el 
numero de observaciones n, en 1 . 

Otra razon por la cual se toma n - 1 es que una muestra generalmente esta un poco menos dispersa que la 
poblacidn de la cual se tomo. Por tanto, existe la tendencia a que la desviacion estandar de la muestra s sea un 
poco menor que la desviacion estandar de la poblacion cr. Este es un hecho infortunado. Vale la pena recordar que 
se intenta utilizar el valor de s como una estimation de < 7 . Sin embargo, s subestimara ade manera consistente. Se 
debe compensar esta condition inflando artificialmente 5 dividiendo por un numero levemente menor n- 1 , en lugar 
de n. 

Para ilustrar la tecnica para establecer estas medidas de dispersion para una muestra, se considera otro 
problema que tiene Boggs en su esfuerzo por ayudar a sus clientes a tomar decisiones sobre inversion. 


Ejemplo 3.5 Varianza y desviacion estandar para una muestra 

El Sr. Boggs desea determinar la estabilidad del precio de una accion en particular. Decide basar su 
juicio en la estabilidad de la desviacion estandar del precio de cierre diario de dicha accion. Al 
revisar las paginas financieras, Boggs sabe que la accion ha sido transada en la bolsa durante algun 
tiempo y que hay muchos precios de cierre desde hace varios meses. En lugar de utilizar todos 
estos precios, Boggs decide simplificar su aritmetica y seleccionar una muestra aleatoria de n = 7 
dias. (Aunque 7 probablemente es una muestra muy pequena, servira por el momento para los 
propositos que se tienen.) Boggs nota que los precios de cierre son de 

US$87, US$120, US$54, US$92, US$73, US$80, y US$63 


Solution 

Entonces, X = US$8 1 .29 y 


2 2(X, - X) 2 

s* — 

n — 1 

= ( 87 ~ 81.29) 2 + 0 2Q ~ 8L29) 2 + ... g jjgg 

7-1 

s 2 = 465.9 cuadrado de dolares 
5 = V465^ - US$21.58 


Interpretation 

Boggs ha estimado que la media del precio de cierre de la accion es de US$8 1 .29, con una tendencia 
a variar por encima o por debajo de dicho precio en US$2 1.58. Una explicacion adicional del uso e 
interpretacion de la desviacion estandar se proporciona mas tarde en este capftulo. Sin embargo, se 
tiene en mente que Boggs puede interpretar siempre la desviacion estandar de US$21.58 como una 
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medida de la tendencia de los precios de cierre que tienden a fluctuar alrededor de su media de 
$81.29 dolares. 


Todos estos estadisticos importantes pueden obtenerse en los computadores utilizando varios paquetes. La 
pantalla 3.1 muestra una copia impresa en Excel para los datos de P&P. Es de destacar que las medidas de 
tendencia central y de dispersion se dan junto con otros estadisticos que se discutiran mas adelante. 

Pantalla 3.1 

Estadisticos descriptivos para P&P 


Mean (Media) 

78.36 

Standard Error (Error estandar) 

1.599938774 

Median (Mediana) 

78.5 

Mode (Moda) 

83 

Standard Deviation (Desviacion estandar) 

11.31327557 

Sample Variance (Varianza de la muestra) 

127.9902041 

Kurtosis (Curtosis) 

-0 . 036918787 

Skewness (Sesgo) 

-0.05225955 

Range ( Rango ) 

52 

Minimum ( Mi nimo ) 

50 

Maximum (Maximo) 

102 

Sum ( Suma ) 

3918 

Count (Conteo) 

50 




Ejercicios de la seccion 


5. Se utilizan dos procesos para producir discos de computador. Han surgido problemas respecto a las 
variaciones en los tamanos de tales discos. Con base en los datos de muestra aqui observados, de ocho 
tamanos de discos en pulgadas para cada proceso, explique cual proceso aconsejarfa usted si su objetivo es 
minimizar la desviacion en el tamano alrededor de la media. 


Proceso 1 Proceso 2 


3.41 

3.22 

3.81 

3.26 

3.74 

3.06 

3.26 

3.79 

3.89 

3.65 

3.07 

3.14 

3.65 

3.33 

3.35 

3.51 


6. Explique con sus propias palabras que miden la varianza y la desviacion estandar. ^Por que su calculo es algo 
diferente para las poblaciones y las muestras? 

7. Un analista de inversiones sugiere que usted invierta en Boomer Securities en lugar de Reliable Stocks. 
Dadas las tasas anuales de rendimiento que se muestran a continuacion para una muestra de cada inversion, 
4 ,que le dice al analista si usted desea minimizar su exposition al riesgo? 
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Boomer 


Reliable 

15.50/0 3.6o/o 


4 . 50/0 6 . 20/0 

21.7 27.2 


5.5 7.2 

-7.8 2.2 


3.5 4.2 

-5.0 12.2 


4.1 


8 . Curly, Moe, y Larry venden seguros de vida para la Shemp Insurance Company. El Sr. Shemp ascendera a uno 
de sus vendedores a un cargo administrative con base en su desempeno en ventas. Su decision depende de 
cual miembro de su equipo de ventas tiene (1) el promedio mas alto en ventas y (2) el registro de ventas mas 
consistente. Dados los siguientes datos de muestra semanales en ventas, ^cual vendedor obtendra el ascenso? 


Curly 

Moe 

Larry 

US$ 986 US$1,265 

1,337 734 

2,745 245 

2,645 5,344 

3,658 4,867 

US$645 US$893 

645 230 

734 415 

822 723 

US$534 US$534 

534 534 

534 534 

534 534 


3.5 Medidas de tendencia central y de dispersion para 
datos agrupados 

A1 trabajar con datos que han sido agrupados en una distribution de frecuencia, no se conoce cuales son las 
observaciones individuales. En una tabla de frecuencia para los pasajeros de P&P, la tabla 2.2, se sabe solamente 
que en tres dias, entre 50 y 59 pasajeros abordaron un avion. No se tienen las cifras exactas de esos tres dias. Sin 
los valores especfficos, los procedimientos mostrados anteriormente para calcular las medidas descriptivas, 
simplemente no se aplican. Deben encontrarse metodos altemativos. Debe tenerse en mente que los calculos 
hechos utilizando datos agrupados son solo aproximaciones. Por tanto, las observaciones individuales no 
agrupadas deberfan utilizarse cuando sea posible. 

A. La media 

A1 calcular la media de datos agrupados, se supone que las observaciones en cada clase son iguales al punto 
medio de la clase. Aunque esto puede ser una suposicion heroica, probablemente se compensa debido a que 
posiblemente algunas de las observaciones superen el punto medio, mientras que otros queden por debajo de el. 
Dada esta suposicion, se debe tener en cuenta la frecuencia y los puntos medios de cada clase cuando se calcule 
la media utilizando datos agrupados. La formula 3.10 hace justo esto. 



- 2fM 2 fM 


Media con datos agrupados 

>< 

Oo 

II 

II 

[3.10] 


en donde / es la frecuencia o numero de observaciones en cada clase 
M es el punto medio de cada clase 

n es el tamano de la muestra y es igual a las frecuencias sumadas en todas las clases. 
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La tabla de frecuencia para Pigs & People Airlines del capitulo 2 se repite en la tabla 3.2 por conveniencia, 
junto con los puntos medios para cada clase, los cuales, como se debe recordar, se determinaron promediando los 
limites superior e inferior. 

Utilizando la formula (3.10), se puede ver que P&P transporto un promedio diario de 78.7 pasajeros. 


S/M 

n 


3935 

50 


= 78.7 pasajeros 


Tabla 3.2 

Distribucion 
de frecuencia 

Clase 

(pasajeros) 

Frecuencia ( f ) 
(d(as) 

M 

fM 

50-59 

3 

54.5 

163.5 

para pasajeros 

60-69 

7 

64.5 

451.5 


70-79 

18 

74.5 

1341.0 


80-89 

12 

84.5 

1014.0 


90-99 

8 

94.5 

756.0 


100-109 

2 

104.5 

209.0 


50 3935.0 


B. La mediana 

Si se han registrado datos en una tabla de frecuencia, no pueden colocarse en un arreglo ordenado para calcular 
la mediana. A manera de ilustracion, se suministra la tabla de frecuencia de P&P Airlines, en la tabla 3.3. 


Tabla 3.3 

Distribucion 
de frecuencia 
para pasajeros 


Clase 

f 

Frecuencia acumulada 

50-59 

3 

3 

60-69 

7 

10 

70-79 

18 

28 

80-89 

12 

40 

90-99 

8 

48 

100-109 

2 

50 


Primero se debe hallar la clase de la mediana de la distribucion de frecuencia. La clase mediana es la clase cuya 
frecuencia acumulada es mayor que o igual a nil. 

Debido a que n es 50, se necesita localizar la primera clase con una frecuencia acumulada de 25 o mas. La 
tercera clase tiene una frecuencia acumulada de 28. La mediana puede determinarse entonces como 


Mediana para datos agrupados 


Mediana = £ . + 

md 



(c) 


[3.11] 


en donde 



es el lfmite inferior de la clase de la mediana (70) 

es la frecuencia acumulada de la clase que antecede a la clase de la mediana (10) 

es la frecuencia de la clase de la mediana (18) 

es el intervalo de clase de la clase de la mediana (TO) 


Utilizando la formula (3. 1 1), se obtiene la mediana: 
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Mediana = 70 + 


50/2 - 10 
18 


10 = 78.33 pasajeros 


Se puede concluir que en 25 dias - la mitad de los 50 dias estudiados - menos de 78.33 pasajeros volaron en P&P 
Airlines, y en los otros 25 dias, mas de 78.33 pasajeros volaron los agradables cielos de P&P. 


C. La moda 


Ya que por definition la moda es la observation que ocurre con mayor frecuencia, se hallara en la clase que tenga 
la frecuencia mas alta, llamada la clase modal. Para estimar la moda en el caso de datos agrupados, se utiliza la 
f6rmula(3.12). 


Moda para datos agrupados 


Moda = L + 

mo 


D„ 


l D b + D a 


(C) 


[3.12] 


en donde 


L es el limite inferior de la clase modal 

mo 

D a es la diferencia entre la frecuencia de la clase modal y la clase que la antecede 

D b es la diferencia entre la frecuencia de la clase modal y la clase que le sigue 

C es el intervalo de clase de la clase modal 


De la tabla 3.3, la moda es 


Moda = 70 + 


18-7 

(18 - 12) + (18 - 7) 


(10) = 76.47 


pasajeros 


D. Varianza y desviacion estandar 

Si los datos estan agrupados en una tabla de frecuencia, la varianza y la desviacion estandar pueden calcularse 
como 


Varianza de la muestra 
de datos agrupados 

, S/M 2 - nX 1 
n — 1 

[3.13] 

y 

Desviacion estandar muestral 
para datos agrupados 

s = V? 

[3.14] 

Los datos de pasajeros para P&P Airlines se utilizaran como ilustracion. 


Ejemplo 3.6 Medidas de dispersion con datos agrupados 


El director de vuelo de P&P requiere information respecto a la dispersion del numero de pasajeros. 
Las decisiones que se tomen respecto a la programacion y al tamano mas eficiente de los aviones, 
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Solucion 


dependera de la fluctuation en el transporte de pasajeros. Si esta variation en ndmero de pasajeros 
es grande, se pueden necesitar aviones mas grandes para evitar el sobrecupo en los dfas en los que 
el transporte de pasajeros es mis solicitado. La tabla de frecuencia para P&P es la siguiente: 


Clase (pasajeros) 

^(dias) 

M 

fM 

M 2 

fM 2 

50-59 

3 

54.5 

163.5 

2,970.25 

8,910.75 

60-69 

7 

64.5 

451.5 

4,160.25 

29,121.75 

70-79 

18 

74.5 

1,341.0 

5,550.25 

99,904.50 

80-89 

12 

84.5 

1,014.0 

7,140.25 

85,683.00 

90-99 

8 

94.5 

756.0 

8,930.25 

71,442.00 

100-109 

2 

104.5 

209.0 

10,920.25 

21,840.50 


o 

LO 

II 

c: 


SAW = 3,935.0 


SAW 2 = 316,902.50 


Se calculo X en un ejemplo anterior 

s pi 


3935 

50 


78.7 


Por tanto, la formula (3. 13) da 

= I/M 2 
* n - 1 


, _ 316,902.50 - 50(78.7) 2 

s _ _ . _ 1473 J pasajeros eJevado al cuadrado 


s — V 147.31 = 12.14 pasajeros 

Interpretation 

El director de vuelo ahora puede decidir si los aviones que se estan utilizando actualmente pueden 
acomodar fluctuaciones en los niveles de pasajeros tal y como lo mide una desviacion estandar de 
12.14. Si no, quiza se utilizaran aviones mas grandes para acomodar cualquier excedente que pueda 
ocurrir en esos dias de trafico pesado. 


Ejercicios de la seccion 


9, El ausentismo diario en su oficina parece ir en aumento. El ano pasado un promedio de 47.8 empleados estuvo 
ausente algunos dfas, con una desviacion estandar de 14.7. Se recolecto una muestra de datos para el ano en curso 
y se ubicaron en la tabla de frecuencias que se muestra a continuacion. Calcule la media, la mediana, la moda, 
y la desviacion estandar para estos datos y comparelos con los del ano anterior. iA que conclusiones llega? 


Numero de empleados 
ausentes 

Dias en los que ese 
numero estuvo ausente 

20-29 

5 

30-39 

9 

40-49 

8 

50-59 

10 

60-69 

12 

70-79 

11 

80-89 

8 

90-99 

3 
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10 . Anteriormente, el tiempo para completar un trabajo determinado en las oficinas de Harmon electronics habia 
arrojado las siguientes estadisticas en horas: una media de 12.2, una mediana de 13.2, y una moda de 14.5. La 
varianzafue de 8.21. Se reflejan datos mas recientes en la siguiente tabla de frecuencias. El Sr. Harmon lo contrata 
como consultor extemo para evaluar los cambios en la eficiencia de los empleados. Calcule los estadisticos 
correspondientes con base en estos datos y prepare un breve informe. ( ,Que conclusiones obtiene? 


Horas tomadas hasta la finalizacion 
del trabajo 

Numero de veces que dicho trabajo 
se tomo este tiempo 

5 y menos de 7 

4 

7 y menos de 9 

8 

9 y menos de 11 

12 

11 y menos de 13 

8 

13 y menos de 15 

5 

15 y menos de 17 

2 


3.6 Otras medidas de dispersion 

Aunque la varianza y la desviacion estandar son las medidas de dispersion mas utiles en analisis estadistico, 
existen otras tecnicas con las cuales puede medirse la dispersion de un conjunto de datos. Estas medidas 
adicionales de dispersion son los cuartiles, los deciles y los percentiles. 

Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El primer cuartil es ese 
valor debajo del cual clasifica el 25% de las observaciones, y sobre el cual puede encontrarse el 75% restante. El 
segundo cuartil es justo la mitad. La mitad de las observaciones estan por debajo y la mitad por encima; en este 
sentido, es lo mismo que la mediana. El tercer cuartil es el valor debajo del cual esta el 75% de las observaciones 
y encima del cual puede encontrarse el 25% restante. 

La determinacion de cuartiles con frecuencia es de utilidad. Por ejemplo muchas escuelas de postgrados 
admitir&i s61o a aquellos estudiantes que esten en el 25% superior (tercer cuartil) de los candidatos. Las empresas, 
con frecuencia, desean senalar las plantas cuyos deficientes registros de production los colocan por debajo del 
cuartil inferior. Con un poco de imagination es posible prever numerosos ejemplos en los cuales la determinacion 
de cuartiles puede ser de gran beneficio. 

Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los percentiles en 100 partes. El 
primer decil es la observation debajo de la cual se encuentra el 10% de las observaciones, mientras que el 90% 
restante se encuentra encima de este. El primer percentil es el valor debajo del cual se encuentra el 1% de las 
observaciones, y el resto estan encima de este. Puede aplicarse una interpretation similar al resto de deciles y 
percentiles. Todo conjunto de datos tiene 9 deciles y 99 percentiles. 

Un percentil y su ubicacion en un arreglo ordenado se identifica mediante los submdices. Por ejemplo, el 
decimoquinto percentil se indica como P l5 , y su ubicacion en la serie ordenada es L [y 

Para ilustrar el calculo de percentiles, se asume que se tienen observaciones para el numero de acciones 
correspondientes a 50 acciones transados en la Bolsa de Valores de Nueva York, como se muestra en la tabla 3.4. 
Vale la pena destacar que los datos han sido puestos en una serie ordenada. El lugar del P esimo percentil se halla 



, , P 


Ubicacion de un percentil 

lp = ("+ 1)^55 

[3.15] 


en donde Lp es el sitio del percentil deseado en una serie ordenada 
n es el numero de observaciones 

P es el percentil deseado 
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Se asume que se desea calcular el percentil 25, P 25 , para las acciones de la tabla 3.4. Se debe hallar primero su 
ubicacion en la serie ordenada. 


L 25 = (50 + 1) 


25 

100 


= 12.75 


Tabla 3.4 

3 

10 

19 

Numeros de acciones 

4 

12 

20 

transadas en la Bolsa 

7 

14 

21 

de Valores de Nueva 

9 

15 

25 

York (en 100's) 

10 

17 

27 


27 

34 

38 

48 

56 

67 

74 

29 

34 

39 

48 

59 

67 

74 

31 

36 

43 

52 

62 

69 

76 

31 

37 

45 

53 

63 

72 

79 

34 

38 

47 

56 

64 

73 

80 


El valor resultante de 1 2.75 dice que el percentil 25 esta ubicado al 75% del trayecto comprendido entre la doceava 
observation, que es 20 y la treceava observation que es 21, es decir, P 25 = 20 + 0.75 (21-20) = 20.75. 

Si se desea calcular el percentil 35, se halla 


- <5 ° + 

= 17.85 

El percentil 35 esta al 85% del trayecto comprendido entre la observation 17, que es 29 y la observation 18 que es 
3 1 , es decir, P 35 = 29 + (0.85)(3 1 - 29) = 30.7 Por tanto el 35% de las observaciones esta por debajo de 30.7 y el 65% 
restante por encima de 30.7 

Regresando a los deciles y cuartiles por un momento, se nota que el primer decil es igual a P 10 , el segundo decil 
es igual a P 20 , y asi sucesivamente. Adicionalmente, el primer cuartil es igual a P 25 , el segundo cuartil es igual a P 50 , 
y P 75 se encuentra en el tercer cuartil. Teniendo esto en mente, el calculo de deciles y cuartiles se vuelve simplemente 
un asunto de determination de los percentiles apropiados de acuerdo con las reglas que se acaban de establecer. 

Una medida unica de dispersion es el rango o recorrido intercuartflico {Interquartile range - RIQ). El RIQ es 
la diferencia entre el tercer cuartil y el primer cuartil. Es decir, P 75 - P 25 . La mitad de las observaciones se clasifican 
dentro de este rango. Consta del 50% de la mitad de las observaciones y corta el 25% inferior y el 25% superior de 
los puntos de datos. Como resultado, el RIQ proporciona una medida de dispersion que no esta muy influenciada 
por unas cuantas observaciones extremas. El rango intercuartil se ilustra en la figura 3.1. 


Figura 3.1 

Recorrido 

intercuartflico 


25% inferior 


25% superior 


Q\ Qi & 

t* RIQ 4 


50% centrado 
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Ejereicios de la seccion 


11. Defina en sus propias palabras: 

a. El percentil 80 

b . El cuarto decil 

c. Eltercercuartil 

12. Utilizando los datos de la tabla 3.4, calcule e interprete: 

a. El rango o recorrido intercuartflico. 

b. Lamediana 

c. El percentil 50 

d. El percentil 70 

e. El tercer decil 


3.7 Usos frecuentes de la desviacion estandar 

Como se ha enfatizado, la desviacion estandar es util para describir un conjunto de datos midiendo el grado de 
dispersion de las observaciones individuales alrededor de su media. Existen dos aplicaciones adicionales para la 
desviacion estandar: (1) Teorema de Chebyshev y (2) la Regia empirica. 


A. Teorema de Chebyshev 

El teorema de Chebyshev (algunas veces escrito teorema de Tchebysheff) fue formulado por el matematico ruso 
P.L. Chebyshev (1821 - 1894). Establece que para todo conjunto de datos, por lo menos 1 - \/K 2 % de las 
observaciones estan dentro de K desviaciones estandar de la media, en donde K es cualquier numero mayor que 
1. El teorema de Chebyshev se expresa como 




‘ l ' 

K\ 


Teorema de Chebyshev 

l - 

[3.16] 


Asi, por ejemplo, si se forma un intervalo d eK= tres desviaciones estandar por encima de la media hasta tres 
desviaciones estandar por debajo de la media, entonces por lo menos 

1 - i = 88.89% 

de todas las observaciones estaran dentro de dicho intervalo. 


Ejemplo 3.7 Teorema de Chebyshev aplicado a Pigs & People Airlines 

El trabajo anterior en este capitulo con datos agrupados para P&P Airlines, revelo una media de 
78.7 pasajeros por dia, con una desviacion estandar de 12.14. Para programar los tiempos para una 
nueva ruta que abrio P&P, la gerencia desea saber con que frecuencia los pasajeros estan dentro de 
K = dos desviaciones estandar de la media, y cual es dicho intervalo. 


Solucion 

Si se transportan dos desviaciones estandar (2 X 12.14) = 24.28 pasajeros por encima y por debajo 
de la media de 78.7, se tendra un intervalo de (78.7 -24.28) = 54.42 a (78.7 + 24.28) = 102.98 pasajeros. 
Se puede estar seguro de que por lo menos 
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1 


2 2 


= 75% 


del tiempo, el numero de pasajeros diarios estuvo entre 54 y 103. 


Interpretation 

En por lo menos el 75% de los dias (es decir, 75% de 50 es igual a 37 dias), el numero de pasajeros 
estuvo entre 54 y 103. Esto proporciona a la gerencia de P&P una valiosa informacion sobre para 
cuantos pasajeros deben prepararse en terminos de operaciones en vuelo. 


B. La distribution normal y la regia empirica 

La desviacion estandar puede utilizarse para sacar ciertas conclusiones si el conjunto de datos en cuestion esta 
distribuido normalmente. El concepto de una distribution normal se encuentra usualmente en analisis estadistico 
y es de importancia considerable. Una discusion minuciosa de la distribucion normal se presenta en capitulos 
posteriores. Sin embargo, una introduction a todo este concepto importante permitira demostrar un uso practico 
para la desviacion estandar, y establecera la base para una futura investigation mas completa. Una distribucion 
normal es una distribucion de datos continuos (no discretos) que produce una curva simetrica en forma de 
campana, como la que muestra la figura 3.2 

Figura 3.2 

Una distribucion 
normal 


Media 

Mediana 

Moda 

Se asume que se tiene un numero grande de observaciones para el tiempo, en minutos, que le toma a los 
esquiadores terminar un trayecto en particular. Si los datos estan distribuidos normalmente, una grafica de la 
frecuencia con la cual ocurre cada observacion tomara la forma de la figura 3 .2. Las observaciones en cada extremo 
ocurriran relativamente de forma poco frecuente, pero las observaciones que estan mas cerca de la mitad ocurriran 
con una frecuencia alta, por tanto se produce la curva simetrica en forma de campana. La observacion modal, 10 
en este caso, es la que ocurre con la mayor frecuencia y por tanto esta en el pico de la distribucion. En una 
distribucion normal, la media, la mediana y la moda son todas iguales. 

Es de importancia que la mitad de las observaciones esti por encima de la media y la mitad esta por debajo. 
Esto significa que la mitad del area que esta bajo la curva esta a la izquierda de la media y la otra mitad del area que 
esta debajo de la curva esta a la derecha de la media. 

Para ilustrar como se aplica la desviacion estandar en la distribucion normal, se asume que 1 ,000 esquiadores 
de slalom bajan una pendiente empinada en Vail. Los tiempos para todos los esquiadores parecen estar distribuidos 
normalmente, con una media de fi= 10 minutos y una desviacion estandar de a = 2 minutos. La regia empirica 
dice que si se incluyen todas las observaciones que estan a una desviacion estandar de la media (una desviacion 
estandar por encima de la media y una desviacion estandar por debajo de la media) estas seran el 68.3% de todas 



X (minutos) 
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las observaciones. Es decir, que no importa cual es la media ni cual es la desviacion estandar, se puede estar 
seguro de que el 68.3% de las observaciones quedan a una desviacion estandar de la media si las observaciones 
estdn distribuidas normalmente. 

Debido a que el promedio de los esquiadores se toma 10 minutos para completar el trayecto, mover una 
desviacion estandar (es decir, 2 minutos) por encima y por debajo de esta media de 10 produce un rango de 8 a 12 
minutos. Asf, de acuerdo con la regia empfrica, 683 (68.3% de 1 ,000) esquiadores se tomaron entre 8 y 12 minutos 
para bajar la montana. 

Claro que si se mueve mas de una desviacion estandar por encima y por debajo de la media, se comprendera 
un porcentaje mas grande de observaciones. La regia empfrica especifica que: 

68.3% de las observaciones estan dentro de mas o menos una desviacion estandar de la media 

95.5% de las observaciones estan dentro de mas o menos dos desviaciones estandar de la media 

99.7% de las observaciones estan dentro de mas o menos tres desviaciones estandar de la media. 

Dados los tiempos de los esquiadores, una desviacion estandar (2 minutos) por encima y por debajo de la media 
de 10 da un rango de 8 a 12 minutos. Dos desviaciones estandar (4 minutos) por encima y por debajo de la media 
de 10 da un rango de 6 a 14 minutos. Tres desviaciones estandar (6 minutos) da un rango de 4 a 16 minutos. Esto 
se muestra en la figura 3.3. 


Figura 3.3 

Tiempos distribuidos 
normalmente de los 
1,000 esquiadores 


fix) 


T3 £ 


CL, 



X minutos 


t J 

L - 68.3% - J 

95.5% 

99.7% 


De acuerdo con la regia empfrica, 997 de los 1,000 esquiadores se tomaron entre 4 y 16 minutos para terminar 
el trayecto. Asf, solo 3 de los 1,000 esquiadores fueron o muy buenos esquiadores y tomaron menos de 4 minutos 
o eran muy malos y se tomaron mas de 16 minutos. Una observation de mas de tres desviaciones estandar de la 
media (por encima o por debajo de esta) es raro que ocurra y se da menos de 1% del tiempo si los datos estan 
distribuidos normalmente. 

Tambien es importante recordar que la regia empfrica describe el area total bajo la curva normal que se 
encuentra dentro de un rango dado. No solo el 68.3% de todos los esquiadores se toman entre 8 y 12 minutos para 
bajar de forma segura la montana, sino que, ademas, el 68.3% de toda el area que esta bajo la curva normal esta 
dentro del mismo rango de 8 a 12 minutos. 

Si las observaciones estan altamente dispersas, la curva en forma de campana se aplanara y se esparcira. Se 
asume que un segundo grupo de esquiadores tambien hizo un promedio de 10 minutos, pero tuvo una desviacion 
estdndar de 4 minutos. Los tiempos del segundo grupo estan mas dispersos que los del primero. Los tiempos mas 
rdpidos en esquf estaban por debajo de 10, y los mas lentos estaban muy por encima de 10, comparados con los 
del primer grupo. Esta dispersidn mayor se reflejarfa en una curva de distribution normal mas extensa, tal y como 
se muestra en la figura 3.4 
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Figura 3.4 

Dos distribuciones 
normales con medias 
iguales pero con 
desviaciones estandar 
diferentes 


(a) 



X minutos 


(b) 



Ambas distribuciones estan centradas en la media de fx = 10 minutos, pero la que tiene la distribucion con 
mayor <7=4 minutos esta mas dispersa que el conjunto de observaciones con menos dispersion. Para abarcar el 
68.3% de las observaciones en este grupo mas disperso, es necesario incluir todas las que estan dentro del 
intervalo de 6 a 14. 


C. Sesgo 

No todas las distribuciones son normales. Algunas estan sesgadas a la izquierda o a la derecha. En la figura 3.5, 
se encuentran las curvas de distribucion para el peso de las personas. En la figura 3.5 (a) se dice que la distribucion 
esta sesgada a la derecha. Parecerfa que las pocas personas mas pesadas que estan en el extremo superior en la 
escala de peso (quiza algunos hombres mas grandes) halan la cola de la distribucion hacia la derecha. En una 
segunda distribucion de pesos que se muestra en la figura 3.5 (b), unas cuantas mujeres diminutas halan la 
distribucion hacia el extremo inferior, haciendo que se desvi'e hacia la izquierda. 


Figura 3.5 

Distribucion sesgadadelpesode 
las personas 

(a) ( b ) 


Moda 


Moda 




En ambos casos, la moda es por definition la observation que ocurre con mayor frecuencia. Por tanto, esta en 
el pico de la distribucion. Sin embargo, como se dijo anteriormente, por su sola naturaleza, la media se ve mas 
afectada por las observaciones extremas. Por tanto, es halada en la direction del sesgo, mas de lo que esta la 
mediana, la cual esta en algun sitio entre la media y la moda. 
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El sesgo puede medirse mediante el coeficiente de sesgo de Pearson. 





Coeficiente de sesgo 

p _ 3(X — mediana) 
s 

[3.17] 


Si P < 0, los datos estan sesgados a la izquierda, si P > 0, entonces estan sesgados a la derecha; si P = 0 estan 
distribuidos normalmente. 


Ejemplo 3.8 Sesgo para los pasajeros de P&P 

Utilizando los datos agrupados de la lista de pasajeros de P&P, se calcula X= 78.7, s = 12.14, y la 
mediana = 78.33. Dada esta information, el director ejecutivo de P&P puede ver claramente que los 
datos estan sesgados a la derecha, debido a que la media excede a la mediana. Ademas, tambien 
desea una medida del grado de sesgo. 

Solution 

Se tiene 


„ 3(78.7 - 78.33) 

r TSi o.o3 


Interpretation 

Debido a que P > 0, los datos para P&P estan, como se presumio, sesgados a la derecha. El grado 
hasta el cual estan sesgados se refleja en el valor del coeficiente de Pearson. Si se fuera a hacer la 
grafica de los datos, aparecerfan como en la figura 3.5 (a). 


D. Coeficiente de variacion 

Como se ha enfatizado, un uso importante de la desviacion estandar es servir como medida de dispersion. Sin 
embargo, se aplican ciertas limitaciones. Cuando se consideran dos o mas distribuciones que tienen medias 
significativamente diferentes, o que estan medidas en unidades distintas, es peligroso sacar conclusiones respecto 
a la dispersion solo con base en la desviacion estandar. Es como violar el viejo adagio sobre la comparacion entre 
manzanas y naranjas. 

Por tanto, con frecuencia debemos considerar el Coeficiente de Variacion (CV), el cual sirve como medida 
relativa de dispersion. El coeficiente de variacion determina el grado de dispersion de un conjunto de datos 
relativo a su media. Se calcula dividiendo la desviacion estandar de una distribution por su media y multiplicando 
por 100. 


$ 

Coeficiente de variacion CV = -^(100) [3.18] 


Los datos agrupados para P&P reportaron una media de 78.7 pasajeros por di'a, con una desviacion estandar 
de 12.14 pasajeros. Se supone que P&P tambien recolecta datos sobre el mismo periodo para el numero de millas 
que la aerolmea volo y dicha media y desviacion estandar ha probado ser de 1,267.5 y 152.7, respectivamente. La 
desviacion estandar mas alta para las millas voladas puede sugerir que estos datos presentan una variacion 
mucho mayor. 
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Sin embargo, si se calcula el coeficiente de variacion para pasajeros, se encuentra que es 

" ’ t^ <100) “ l5 - 43 

mientras que para las millas es solamente 

Cl '= i £ (,00) ' 1205 

Es claro que al comparar la variacion en dos conjuntos de datos muy diferentes, es sabio utilizar el coeficiente de 
variacion y no solo la desviacion estandar. 


Ejercicios de la seccion 


13 . Un conjunto de datos sobre el peso del contenido de 1000 bolsas de comida para perros marca Happy Pooch 
tiene una media de 50 libras y una desviacion estandar de 2.3 libras. No se sabe si los datos estan distribuidos 
normalmente. Los fabricantes de Happy Pooch esperan que por lo menos 750 de tales bolsas pesen entre 45.4 
y 54.6 libras. ^Que seguridad puede darles? 

14 . Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una desviacion estandar de 450. 
Que porcentaje de las observaciones estan: 

a . ^Entre 4550 y 5450? 

b. / Entre 41 00 y 5900? 

c. ^Entre 3650 y 6350? 

d. ^Por encima de 6350? 

e . ^Pordebajode4550? 

15 . Shard Lumber corta troncos a una longitud media de 20 pies, con una desviacion estandar de 3.5 pies. Si los 
cortes estan distribuidos normalmente, que porcentaje de troncos tienen menos de: 

a. 4,16.5 pies? 

b. 4 13 pies? 

16 . Datos sobre las edades de los 100 mejores ejecutivos de las mejores 500 firmas de la revista Fortune revelan 
una edad media de 56.2 anos y una desviacion estandar de 12.7 anos. Su ingreso medio es US$89,432, con s= 
US$16,097. ^Cual variable, edad o ingreso, presenta la mayor variacion? 

17 . Si el ingreso medio del ejercicio 16 es de $87,567 dolares, 

a. ^Los datos estan sesgados a la derecha, a la izquierda o distribuidos normalmente? 

b. ^Cual es el coeficiente de sesgo de Pearson? 


Problemas resueltos 

1. La informacion paga Una emision del ano 1996 de Inc. Technology reporto que Information Please , una 
nueva firma que vende informacion por internet, registro el siguiente numero de “topes” que tuvo cada hora 
47, 52, 69, 72, 112, 36, 28, 68 , 69 y 41. Suponga que el gerente desea evaluar estos datos con base en sus 
medidas de tendencia central y de dispersion. 
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La media es 


Dada la serie ordenada 28, 36, 4 1 , 47, 52, 68, 69, 69, 72, 1 1 2, la position de la mediana es 

n + 1 


Position de la mediana 


5.5 


y la mediana es el promedio de las observaciones quinta y sexta o 52 + 68 / 2 = 60. La moda es la observation 
que ocurrio mas frecuentemente, 69. La varianza es 

. . 52^4 , 

n - 1 9 

y la desviacion estandar es V584.933 = 24.185. 


2. Pesaje Los miembros de Heart-to-Heart Health Club deben pagar cuotas con base en su peso promedio. De 
los60miembros, 12pesaron 1 10 libras, 25 pesaron 120 libras, 1 8 hicieron girar la balanza hasta 150y elresto 
registraron 1 80 libras. Si los miembros deben pagar US$5 por cada libra que pesan en promedio, ^cuanto debe 
desembolsar cada uno? 

Debido a que cada categorfa de peso contiene un numero diferente de miembros, la media ponderada es necesaria. 


Libras (X) 

Numero de miembros (W) 

xw 

no 

12 

1320 

120 

25 

3000 

150 

18 

2700 

180 

5 

900 


60 = 

7920 = 1XV\! 


1XW 


= 132 libras 


Asi, cada miembro debe pagar 132 3 5 = US$660 

3. Dificultades iniciales El descontento de los empleados de Bates Electronics se refleja en el numero de 
quejas oficiales durante lo ultimos cuatro meses: 23, 41, 37 y 49. Con base en estos datos, ^cual es el 
incremento promedio mensual en las quejas? 

La media geometrica, cuyo trabajo es determinar el cambio porcentual promedio en el tiempo, requiere que 
primero se determine que porcentaje de cada numero es del mes anterior: 


Mes 

Quejas 

Porcentaje con respecto al mes anterior 

1 

23 

- 

2 

41 

1.78 

3 

37 

0.90 

4 

49 

1.32 


Entonces, 

MG = V(X,)(X 2 ) . . . 00 = ^(1.78)(0.9)(1.32) = 128 


Entonces, 1.28 - 100 = 28% de incremento mensual medio en quejas. 
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4. Personas que culdan Los estadisticos del programa de Meals on Wheels (comida sobre ruedas), el cual lleva 
comidas calientes a enfermos confinados en casa, desean evaluar sus servicios. El numero de comidas diarias 
que suministran aparece en la siguiente tabla de frecuencia. 


Numero de comidas por dia 

Numero de dfas 

M 

fM 

fM 2 

0-5 

3 

2.5 

7.5 

18,75 

6-11 

6 

8.5 

51.0 

433.50 

12-17 

5 

14.5 

72.5 

1,051.25 

18-23 

8 

20.5 

164.0 

3,362.00 

24-29 

2 

26.5 

53.0 

1,404.50 

30-35 

3 

32.5 

97.5 

3,168.75 


27 


445.5 

9,438.75 


La media, la mediana y el numero modal de comidas son 

- 2/Af 445.5 

X = = — — = 16.5 comidas por dia 

s n 27 

Mediana = — - j(c) 

- » ♦ N^]« 

= 17.4 comidas 
MiKia ■ l ~ + 

■ 18 + [rh] (6) 

- 20 comidas 

La varianza y la desviacion estandar son __ 

, ZJM 2 - nX 2 

fm .-i - 

™ 9438.75 - 27(16.5) 2 
27-1 

= 80.31 

s = V80.31 = 8.96 comidas 


Lista de formulas 


[3.1] 

X, 

4- X 2 + X 3 4 * • * 4 X N 

jlj i 

im | 

/i 

N 

N 

[3.2] 

v-*L 

4 X 2 + X 3 4- • • • + X n 

±x, 

i = i 

A — 

n 

n 

[3.3] 

Posicidn de la mediana = 

2 



Media poblacional 


Media muestral 

Determina la position de la mediana en 
una serie ordenada 
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[3.4] 


* .. 2XW 
w m 


[3-5] 

[3.6] 

[3.7] 

[3.8] 

[3.9] 

[3.10] 

[3.11] 

[3.12] 

[3.13] 


MG = V(X,)(X 2 ) . . . (XJ 


a 2 XX, ~ A) 2 

N 

<j = 

^ S(X,-X ) 2 

n 

s = V? 


* « 


Mediana = + 


Moda = r + 


n/2 - F 
Tmd 

A, 

A~ A 


(c) 

(c) 


2 _ S/M 2 - nX 2 
' ~ n- 1 


Determina la media ponderada 

Calcula el cambio porcentual promedio 

Varianza poblacional 
Desviacion estandar poblacional 

Varianza muestral 

Desviacion estandar muestral 
Media para datos agrupados 

Mediana para datos agrupados 

Moda para datos agrupados 
Varianza muestral para datos agrupados 


[3.14] 

[3.15] 

[3.16] 

[3.17] 

[3.18] 


s = Vs 2 


L p - (n + 



1 


a: 2 


p = 


3(X - mediana) 

5 



Desviacion estandar para datos 
agrupados 

Ubicacion de un percentil 
Teorema de Chebyshev 
Coeficiente de sesgo 

Coeficiente de variacion 


Ejercicios del capitulo 

18 . Los precios de las acciones estan cotizados en octavos de dolar de manera que por ejemplo, 5 1/8 es 
US$5,125, 5 V* es US$5.25, 5 3/8 es US$5,375 y asf sucesivamente hasta 5 7/8, que es US$5,875. A continuacion 
se da una muestra de siete precios de cierre de las acciones tomadas de The Wall Street Journal de octubre 
8de 1997. 


Walt Mart 

27 3/8 

General Mills 

69 7/8 

Disney 

42 5/8 

Toys R Us 

38 5/8 

Mobil 

69 7/8 

Dow Jones 

29 1/4 

General Motors 

39 1/2 
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a. Calcule la media, la mediana, y la moda. Interprete cada estadfstico. ^Que le dice cada una? [For que son 
diferentes si todas son promedios? 

b. Calcule e interprete la varianza y la desviacion estandar. 

c. Calcule e interprete el rango o recorrido intercuartflico. 

d. Calcule e interprete el percentil cuarenta. 

19 . The Snowflake comercializa botas para esquiar en San Luis Obispo, California. De los ultimos 100 pares 
vendidos, 4 eran talla 9, 33 talla 9 Vi, 26 talla 10, 29 talla 10 Vi y 8 eran talla 13. Haga comentarios sobre el uso 
de la media, la mediana y la moda como medidas de tendencia central y el uso de cada una en la toma de 
decisiones sobre los tamanos que se deben tener en inventario. Calcule cada medida. 

20 . Debido a que las tasas de interes cayeron a comienzos de 1997, se encontro que una muestra de las tasas 
hipotecarias para hipotecas a 15 anos de las instituciones de credito en Peoria, Illinois era 

7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85% 

a. Calcule e interprete la media, la mediana y la moda. 

b. ^Estos datos estan sesgados a la izquierda, a la derecha, o estan distribuidos normalmente? Calcule el 
coeficiente de Pearson como medida de sesgo. 

c. Calcule e interprete la varianza y la desviacion estandar. 

21 . Una encuesta de instituciones de credito en un centro urbano cerca de Peoria (ver problema anterior) revelo 
tasas de credito hipotecario de 

7.1%, 7.3%, 6.3%, 6.7%, 6.8%, 6.85%, 7.5% 

a . ^Las tasas de credito hipotecario son mas altas en Peoria o en otros centros urbanos? 

b. ^Cual ciudad parece tener las tasas de interes mas consistentes entre las instituciones? 

c. Calcule e interprete el coeficiente de sesgo de Pearson. 

22 . Alan Munday fabrica una pintura sellante para automoviles en el area de Denver. El utiliza cuatro quimicos 
diferentes en el proceso de production. Para hacer su producto, Munday debe utilizar 2 galones de calcimina 
que cuesta US$2.50 el galon, Vi galon de kalsolita a US$1.25 por galon, 1 galon de aglutinante que cuesta 
US$0.75 el galon, y 3 galones de aceite seeante a US$2.00 por galon. Calcule el costo de un galon de sellante. 

23 . La emision de la revista Business Week del 31 de mayo de 1997 reporto que el numero de transacciones en 
miles de millones de dolares realizadas en las instalaciones bancarias de la nation ATM fueron 


1991 

3.9 

1994 

4.5 

1992 

4.1 

1995 

6.5 

1993 

4.3 

1996 

6.5 


La industria bancaria intenta prepararse para 8 miles de millones de transacciones para el ano de 1998. ^Sera 
suficiente para manejar el nivel de actividad que usted pronostica para ese ano? 

24 . The Noah Fence Company vende cuatro tipos de cercas a los barrios residenciales de las afueras de la ciudad. 
El grado A le cuesta a Noah US$5.00 por pie lineal de instalacion, el grado B cuesta US$3.50, el grado C cuesta 
US$2.50, y el grado D cuesta US$2.00. Ayer, Noah instalo 100 yardas del grado A, 150 del grado B, 75 yardas 
del grado C y 200 yardas del grado D. ^Cual fue el costo promedio de instalacion por pie lineal? 

25 . Una muestra de los recibos de ventas semanales para Pig-In- A-Poke Bar-B-Q esta en cientos de dolares, 

43.3, 54.2, 34.8, 42.9, 49.2, 29.5, 28.6 

Se implementa un pro grama publicitario disenado para emparejar las ventas. Una muestra subsiguiente de 
ventas es 
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45.5, 39.5, 35.7, 36.7, 42.6, 42.14 

^La campana publicitaria logro su meta de suavizar las ventas semanales? 

26. Bill Karl compro 20 acciones a US$ 1 5 cada una, 50 acciones a US$20 cada una, 1 00 acciones a US$30 cada una 
y 75 acciones a US$35 cada una. 

a. ^Cual es el monto total de su inversion? 

b. ^Cual es el precio promedio por action? 

27. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la nation reportadas en 
la edicion de la revista Forbes de la edicion del 24 de mayo de 1997 aparecen en la siguiente tabla de 
frecuencias. 

a . Calcule e interprete la media, la mediana y la moda. 

b. Calcule e interprete la varianza y la desviacion estandar. 


Edades 

Frecuencias 

50 y menos de 55 

8 

55 y menos de 60 

13 

60 y menos de 65 

15 

65 y menos de 70 

10 

70 y menos de 75 

3 

75 y menos de 80 

1 


28. La misma edicion de la revista Forbes (que se vio en el problema anterior) tambien proporciono datos sobre 
los salarios en miles de dolares. Resulto la siguiente tabla de frecuencias: 


Salario (en miles de dolares) 

Frecuencias 

90 y menos de 440 

9 

440 y menos de 790 

11 

790 y menos de 1140 

10 

1140 y menos de 1490 

8 

1490 y menos de 1840 

4 

1840 y menos de 2190 

3 

2190 y menos de 2540 

5 


a . Calcule la media, la mediana y la moda. Interprete sus respuestas. 

b. ^Los salarios estan tan dispersos como las edades del problema anterior? 

29 . Janna Vice utiliza dos maquinas diferentes para produeir papeleras para las fotocopiadoras Kodak. Una muestra 
de las papeleras de la primera maquina midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4, 1 1.3 y 12.3 pulgadas. Las bandejas 
elaboradas con la segunda maquina midieron 1 2.2, 1 1 .9, 1 1 .5, 1 2. 1 , 1 2.2, 1 1 .9 y 1 1 .8 pulgadas. Janna debe utilizar 
la mdquina con la mayor consistencia en los tamanos de las papeleras. ^Cual maquina debe utilizar? 

30 . Los puntajes de las dos primeras pruebas de estadistica que usted presento estaban distribuidos normalmente 
y reportaron medias de 90 para la prueba A y 50 para la prueba B . <?,Usted espera una desviacion estandar mas 
alta o mas baja para la prueba A? ^Le gustarfa una desviacion estandar mas alta o mas baja para la prueba B 
si siente que le fue bien en la prueba? ^Por que? Haga una grafica que ilustre la logica de sus respuestas. 

31 . Los siguientes datos de muestras se han obtenido para el numero de clientes diarios en Rosie’s Flower 
Shoppe: 

34,45,23,34,26,32,31,41 

Calcule la varianza, la desviacion estandar y el rango o recorrido intercuartflico. 
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32. La siguiente es una muestra de las ganancias por action en dolares, para las acciones cotizadas en la Bolsa 
de Valores de Nueva York: 

1.12, 1.43,2.17,-1.19,2.87, -1.49 

Calcule la varianza, la desviacion estandar y el rango o recorrido intercuartflico. Interprete cada uno. 

33. Las horas trabajadas por Ronnie cada semana durante los ultimos dos meses son 

52 48 37 54 48 15 42 12 
Asumiendo que estos son datos muestrales, calcule: 

a . La media 

b. Lamediana 

c. Lamoda 

d. ^Cual es probablemente una mejor medida para el punto central? 

34. Utilizando las horas de trabajo de Ronnie del problema anterior, calcule e interprete: 

a. El rango 

b. La varianza 

c. La desviacion estandar 

d. El primer cuartil 

e. El percentil 25 

/ El rango o recorrido intercuartflico 

35. Quienes ponen los discos en KAYS daman que ponen mas canciones cada hora que sus rivales de la KROC 
del otro pueblo. Durante las ultimas 24 horas se recolectaron y tabularon los datos sobre el numero de 
canciones puestas por ambas estaciones. Utilice los datos para preparar un reporte que compare las dos 
estaciones. Su reporte terminado debe presentarse a la Comision Federal de Comunicaciones, y debe contener 
referencias respecto a las medidas de tendencia central y de dispersion. 


Numero de canciones por hora 

KAYS 

KROC 

5-10 

2 

4 

11-16 

4 

5 

17-22 

6 

7 

23-28 

8 

5 

29-34 

2 

2 

35-40 

2 

1 


36. The Wall Street Journal describio una disputa entre la gerencia y el sindicato de trabajo local respecto a la 
eficiencia y productividad de los trabaj adores. La gerencia argumentaba que a los empleados les tomaba mas 
de 20 minutos terminar cierto trabajo. Si se mide el tiempo de 85 empleados, arrojando los resultados tabulados, 
con base en esta muestra, ^la gerencia esta en lo correcto? Calcule las tres medidas de tendencia central. 


Clase 

(numero de minutos) 

Frecuencia 

(numero de empleados) 

5 y menos de 7 

2 

7 y menos de 9 

8 

9 y menos de 11 

10 

11 y menos de 13 

15 

13 y menos de 15 

17 

15 y menos de 17 

14 

17 y menos de 19 

7 

19 y menos de 21 

9 

21 y menos de 23 

3 
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37 . En el ejercicio anterior, la gerencia tambien se encuentra preocupada porque el desemperio de los empleados es 
demasiado erratico; no existe mucha variacion en la cantidad de tiempo que toma a los trabajadores completar un 
trabajo. Identifique y calcule el estadistico apropiado de acuerdo con la preocupacion de la gerencia. 

38 . Dados los siguientes puntajes de 9 pruebas para la clase de economia del profesor Pundit, calcule el coeficiente 
de sesgo de Pearson. Asuma que estos son datos muestrales. 

80 83 87 85 90 86 84 82 88 

39 . Los sindicalistas de la planta de Ford Motor Company en Toledo argumentan que, en contravencion del 
contrato laboral, los trabajadores de la lrnea de produccion hacen un promedio salarial por hora menor con 
una mayor variabilidad que los trabajadores de oficina. Una muestra de n = 10 se toma de cada clase de 
trabajadores, arrojando los siguiente valores. £ Tales valores apoyan a los sindicalistas? 


Trabajadores 

Trabajadores de produccion 

Trabajadores de oficina 

1 

12.15 

15.12 

2 

18.17 

18.42 

3 

19.42 

17.12 

4 

15.17 

16.92 

5 

18.63 

18.15 

6 

16.42 

15.81 

7 

15.49 

19.12 

8 

18.73 

19.15 

9 

19.12 

18.73 

10 

18.36 

19.66 


40 . Dos marcas de zapatos para correr fueron evaluados en cuanto a uso y desgaste. Cada una reporto los 
siguientes numeros de horas de uso antes que se detectara un desgaste significativo. 


Marca A 

Marca B 

97 

78 

83 

56 

75 

87 

82 

54 

98 

89 

65 

65 

75 



a. ^Cual zapato parece presentar mayor desgaste? 

b. Cual zapato parece tener un programa de control de calidad que produzca la mejor consistencia en su 
desgaste? 

41 . Manly Bankford trabaja como corredor para E. F. Hutton. Sus registros muestran que las tasas de rendimiento 
(en porcentaje) sobre dos valores para 10 meses seleccionados fueron de 


Valor 1 

5.6 

7.2 

6.3 

6.3 

7.1 


8.2 

7.9 

5.3 

6.2 

6.2 

Valor 2 

7.5 

7.3 

6.2 

8.3 

8.2 


8.0 

8.1 

7.3 

5.9 

5.3 


a . ^Cual valor puede ser mejor para los clientes que estan interesados en un rendimiento mas alto? 

b. <?,Cual valor deberia aconsejar Manly a sus clientes que prefieren menos riesgo? 
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42 Aquf se muestran las relaciones precio-ganancia para 30 acciones diferentes transadas en la Bolsa de Valores 
de Nueva York (New York Stock Exchange - NYSE) 


4.8 

5.2 

7.6 

5.7 

6.2 

6.6 

7.5 

8.0 

9.0 

7.7 

3.7 

7.3 

6.7 

7.7 

8.2 

9.2 

8.3 

7.3 

8.2 

6.5 

5.4 

9.3 

10.0 

7.3 

8.2 

9.7 

8.4 

4.7 

7.4 

8.3 


a. Calcule la media y la desviacion estandar. 

b. De acuerdo con el teorema de Chebyshev, por lo menos ^cuantas relaciones precio-ganancia estan dentro 
de dos desviaciones estandar de la media? 

c. ( ',Cuantas estan realmente a dos desviaciones estandar de la media? 

43 . La mecanica local en Vinney’s Auto Shop y Charm School le dice que las reparaciones de su carro le costaran 
US$7 14. 12. Los datos de la industria muestran que la cuenta promedio por reparaciones parecidas a las suyas 
es de US$615, con una desviacion estandar de US$31. ^Que puede concluir sobre las tasas de Vinney’s si 
usted asume que las reparaciones estan distribuidas normalmente? 

44 . Dada la siguiente tabla de frecuencias de las ventas mensuales en dolares para equipos de paracaidismo en 
el mercado del sur de California (las cifras estan en cientos). 


Clase (en US$1 00*s) 

Numero de meses 

"5 y menos de 10 

5 

10 y menos de 15 

7 

15 y menos de 20 

9 

20 y menos de 25 

10 

25 y menos de 30 

8 

30 y menos de 35 

3 

35 y menos de 40 

2 


a. Usted es estadistico jefe para Bounce Twice Parachute Company, y su gerente solicita un desglose de la 
frecuencia de ventas. El esta interesado en el valor debajo del cual estan a lo sumo el 60% de las 
observaciones, junto con un desglose completo en cuartiles. 

b. Ademas, usted siente que serfa de utilidad determinar los valores de los percentiles 10 y 90. 

45 . Una supervisora en una planta ensambladora recibio las siguientes clasificaciones de eficiencia durante 12 
meses 

56, 69, 48, 75, 65, 72, 81, 43, 61, 42, 36, 52, 

a. Si ella desea crear la impresion mas favorable, ^deberfa reportar la media, la mediana o la moda en su 
autoevaluacion anual? 

b. (,Que tan consistentes han sido sus medidas? 


Ejercicios por computador 

Entre al archivo OUTPUT en su disco de datos. Contiene 100 observaciones de la produccion semanal de Leisure 
Sports, un fabricante de productos deportivos con sede en Cleveland. Ernst Rawls, Director de Operaciones 
Corporativas esta preocupado por cumplir con el itinerario de produccion establecido en la asamblea de noviembre 
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pasado que busca una production semanal de por lo menos 1000 unidades. El senor Rawls tambien debe librarse 
de grandes variaciones en la production de una semana a otra. 

Utilizando el software de su computador, prepare un informe para el Sr. Rawls tal y como se describe en el 
aptiidice 1. Incluya todos los estadfsticos descriptivos, analisis de descubrimientos y sus conclusiones y 
recomendaciones. 



PUESTA EN ESCENA 


fa ei planteamiento del Escenario a comienzos de este 
^pltulo usted debia funcionar eomo analista de inversiones 
para evaluar los tres fondos ofrecidos por Janus. Asuma 

' quelos fondos dieron los rendimientos aqui mostrados. 

im ' . . 


mu 

Ano 

Riesgo 

Ingresos 

Desarrollo 


1 

14.2% 

9.2% 

22,2% 

i8ih 
IP !>'’ 

Kpi m ; 

2 

9.2 

10.5 

15.1 


3 

19.9 

11.5 

10.5 

:: :: 
KilfiiJ!;;:.:: 

4 

21.5 

12.4 

10.8 

Hi: 

5 

22.8 

15.8 

11.8 


6 

25.1 

17.2 

12.8 


Utilizando las herramientas descriptivas presentadas 
en este capftulo, proporcione una descripcion comparativa 
de cada fondo. Incluya todas las medidas de tendencia 
central y las medidas de dispersidn. ^Que conclusiones 
puede sacar respecto al desempenio de cada fondo? 

Si su cliente invirtid el 30% de su cartera en fondos de 
riesgo, el 50% en fondos de ingreso, y el resto en fondos de 
desarrollo, ^cudl seria el rendimiento anual promedio? 4 Que 
rendimientos proyectaria para cada fondo en el ano 7 ? 


Del escenario a la vida real 

La forma mils comun de reportar rendimientos de fondos mutuos es con rendimientos a un ano, tres anos, cinco 
anos y diez anos. Se observaran fondos en Vanguard Group ( www.vanguard.com ). En Home Page, seleccione el 
icono de “fondos mutuos”. Luego haga clic sobre “fondos por categorfa”. Encontrara rendimientos a un ano, tres 
anos, cinco anos y diez anos para fondos individuales junto con el fndice de Standard & Poor’s. The Vanguard 
Funds estan agrupados en Desarrollo, Desarrollo e Ingreso, y otras categorias. Seleccione 5 fondos especlficos 
de cada una de las categorias de Desarrollo y de Desarrollo e Ingreso y los datos de Standard & Poor’s en este 
sitio. Utilizando las herramientas descriptivas de este capftulo y del capftulo 2, proporcione descripciones 
comparativas de cada fondo con los resultados de Standard & Poor’s. 

Despues de que usted haya terminado sus analisis, usted puede querer comparar sus tecnicas con los analisis 
proporcionados por algunos sitios populares de la “Gufa de Inversionistas”: 

Net Worth Mutual Fund Market Manager http://networth.quicken.com/investments 

Mutual Fund Investor’s Center www.mfea.com 

Tradeline Mutual Fund Center http://nestegg.iddis.com 

Estos sitios tienen enlaces con los home pages de importantes empresas de fondos. Usted puede querer comparar 
Vanguard Funds con los de otra companfa como Fidelity o Dreyfus. 





Plan del capftulo 


Muchas decisiones administrativas se apoyan en los posibles resultados de tales decisiones. Este capftulo 
analiza las formas como se puede determinar la probabilidad relacionada con tales resultados. A 1 establecer la 
posibilidad o probabilidad de eventos futuros, se puede reducir ampliamente el riesgo en el proceso de toma de 

decisiones. 

* . .... • 


Principios de probabilidad 


Introduction 
a la 

probabilidad 


Relaciones 
entre eventos 


Reg las 
de 

probabilidad 


Tablas 

de contingencia 
y tablas 


Probabilidad 

conditional 


Arboles 

de 

probabilidades 
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La Asociacion Nacional de Esquf estudid el impacto 
finaneiero de la ubicacion de los 850 centros de esquf de 
Estados Unidos (Forbes, mayo 1996). El proposito era 
determinar si un centro ubicado cerca de un centro urbano 
atrafa mas esquiadores o tenfa mas utilidades que un centro 
mas aislado. La comparacion inclufa tambien los centros de 
esquf situados muy cerca de otros centros-similares 
llamados concentracion de centros de esquf. Michael Berry, 
presidente de la Asociacion Nacional de Areas de Esquf 
expreso: “Muchas zonas para esquiar enfrentan una alta 
probabilidad de quedar en bancarrota en las estaciones 
venideras” 

Con base en este estudio, es posible identificar los 
centros cuyas posiciones financieras tienen mas 
probabilidad de presentar un descenso, y permitirles tomar 
las acciones correctivas que pennitan aumentar sus ingresos 
economicos. 

Como consultor contratado por Berry usted tiene la 
labor de proporcionar una evaluation comparativa sobre el 


futuro de tales centros y su potencial de dxito. Esta labor 
necesitara de toda su experiencia en principios de 
probabilidad. 



4.1 Introduction 

Sin tener en cuenta la profesion que se haya elegido, algo si es seguro: en algun momento se han de tomar 
decisiones. Con mucha frecuencia esto tendra que hacerse sin conocer todas las consecuencias de tales decisiones. 
Por ejemplo, los inversionistas deben decidir sobre la conveniencia de invertir en una action en particular, con 
base en sus expectativas sobre rendimientos futuros. Los empresarios, al decidir comercializar un producto 
enfrentan la incertidumbre sobre la posibilidad de exito. En cada caso, como sucede con la mayorfa de los asuntos 
comerciales, se han de tomar decisiones sin toda la information pertinente. 

Todo esfuerzo por reducir el nivel de incertidumbre en el proceso de toma de decisiones incremental 
enormemente la probabilidad de que se tomen decisiones mas inteligentes y bien informadas. El proposito de este 
capftulo es ilustrar las formas en las cuales puede medirse la posibilidad o probabilidad de ocurrencia de eventos 
futuros. Al mejorar la habilidad para juzgar la ocurrencia de eventos futuros, se puede minimizar el riesgo y la 
especulacion arriesgada relacionadas con el proceso de toma de decisiones. 


4.2 Experimentos, resultados y conjuntos 

La probabilidad es la posibilidad numerica de que ocurra un evento. La probabilidad de un evento es medida por 
valores comprendidos entre 0 y 1. Entre mayor sea la probabilidad de que ocurra un evento, su probabilidad 
asignada estara mas proxima a 1. La probabilidad de certeza es 1 . La probabilidad de una imposibilidad es 0. Esto 
se podrfa expresar asf: 
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P (evento cierto) = 1 
P (evento imposible) = 0 
Por tanto, 0 < P (E) < 1 

en donde E. es algun evento. 

La probabilidad de que el sol saiga manana es muy alta - muy cercana a 1 . La probabilidad de que se apruebe 
este curso sin estudiar, estando en el otro extremo, esta muy cerca de cero. 


Probabilidad Es la posibilidad numerica, medida entre 0 y 1, de que ocurra un 
evento. 


El proceso que produce un evento es denominado experimento. Un experimento es toda action bien definida 
que conlleva a un resultado unico bien definido. Lanzar un dado (mitad de un par de dados) es un experimento. Un 
resultado bien definido es un numero de 1 a 6. Un experimento puede consistir en revisar un producto para 
determinar si cumple con ciertas especificaciones de fabricacion. El resultado es o (1) defectuoso o (2) no defectuoso. 

El conjunto de todos los posibles resultados para un experimento es el espacio muestral. El espacio muestral 
para lanzar un dado es 


SS =(1,2, 3,4, 5, 6) 

mientras que el espacio muestral para el experimento de lanzar una moneda al aire es: 

SS = (caras, sellos) 

La probabilidad de que al menos uno de los eventos que estan en el espacio muestral ocurra es igual a 1. Si se lanza 
un dado, el resultado debe ser un numero entre 1 y 6. Debido a que esto es una certeza puede decirse que 

2 P (£,.) = ! 


4.3 Introduccion a la probabilidad 

En la actualidad vemos que la teorfa de la probabilidad ocupa un lugar importante en muchos asuntos de negocios. 
Los seguros y practicas actuariales se basan firmemente en los principios de la teorfa de la probabilidad. Las 
polizas de seguros de vida dependen de las tablas de mortalidad, las cuales a su vez se basan en las probabilidades 
de muerte en edades especificas. Otras tasas de seguros tales como seguro de bienes raices y de automoviles se 
determinan de manera similar. La probabilidad tambien juega un papel importante en la estimation del numero de 
unidades defectuosas en un proceso de fabricacion, la probabilidad de recibir pagos sobre cuentas por cobrar y 
las ventas potenciales de un nuevo producto. Incluso los apostadores profesionales en eventos deportivos 
deben tener una comprension solida de la teorfa de la probabilidad. 

A pesar de la difundida aplicacion de los principios de la probabilidad, existen solo tres formas generalmente 
aceptadas para enfocar: (1) el modelo de frecuencia relativa {a posteriori ), (2) el modelo subjetivo y (3) el modelo 
clasico (o a priori ). 

El modelo de frecuencia relativa utiliza datos que se han observado empiricamente, registra la frecuencia con 
que ha ocurrido algun evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base 
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en estos datos historicos. La probabilidad de un evento con base en el modelo de frecuencia relativa se determina 
mediante 


Frecuencia 

p Numero de veces que ha ocurrido el evento en el pasado 

\A ll 

relativa 

Numero total de observaciones 

[H-. 1 J 


Por ejemplo, asumiendo que durante el ano anterior hubo 50 nacimientos en un hospital local, de los cuales 32 
de los recien nacidos eran ninas. El modelo de frecuencia relativa re vela que la probabilidad de que el siguiente 
nacimiento (o un nacimiento seleccionado aleatoriamente) sea una nina es 


P(nina) = 


Numero de ninas que nacio el ano anterior 
Numero total de nacimientos 


32 

50 


Otro ejemplo. Un importador de cristal irlandes de Nueva York recibe envios de cajas de tres articulos. Los 
datos para las ultimas 100 cajas indicaron el numero de articulos danados que habia en cada caja. Por ejemplo, 
mostraba que en 40 de las cajas ningun articulo se habia danado mientras que en 12 de las cajas todos los tres 
articulos se habfan roto. 


Resultado (E) 

(numero de defectos) 

Numero 
de cajas 

P (E,) 

0 

40 

40/100 = 0.40 

1 

27 

27/100 = 0.27 

2 

21 

21/100 = 0.21 

3 

12 

12/100 = 0.12 


100 

Too 


En el pasado, 21 de las 100 cajas totales conteman exactamente dos articulos danados. Entonces el modelo de 
frecuencia relativa asignarfa una probabilidad de que dos articulos en cualquier caja dada estuvieran danados asi 
P( 2) = 2 1 / 1 00 = 0.2 1 . La probabilidad para cada resultado individual se muestra en la ultima columna, la cual suma 1 . 

Un problema comun con el modelo de frecuencia relativa resulta cuando se hacen estimaciones con un 
numero insuficiente de observaciones. Por ejemplo, se asume que en los dos vuelos de una aerolmea en los que 
se hicieron registros el ano pasado estuvieron retrasados al llegar a sus destinos. Por tanto, se concluye que el 
vuelo que se abordara el proximo mes de la misma aerolmea, tambien estara retrasado. Aunque tales inferencias 
son comunes, no existen suficientes datos como para sacar tal conclusion y se deben evitar las decisiones 
basadas en tales inferencias. 

En muchos casos los datos pasados no se encuentran disponibles. Por tanto, no es posible calcular la 
probabilidad a partir del desempeno anterior. La unica altemativa es estimar la probabilidad con base en nuestro 
mejorcriterio. El modelo subjetivo requiere establecer la probabilidad de algun evento con base en la mejor 
evidencia disponible. En muchos casos esto puede ser apenas una conjetura hecha sobre cierta base. El modelo 
subjetivo se utiliza cuando se desea asignar probabilidad a un evento que nunca ha ocurrido. La probabilidad de 
que una mujer sea elegida como presidente de los Estados Unidos es un ejemplo. Debido a que no hay datos 
sobre los cuales confiar, se deben analizar las opiniones y creencias para obtener una estimation subjetiva. 

De los tres metodos para medir la probabilidad, el modelo clasico es el que se relaciona con mayor frecuencia 
con las apuestas y juegos de azar. La probabilidad clasica de un evento E se determina mediante: 
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Modelo clasico 




Numero de formas en las que puede ocurrir un evento 
Numero total de posibles resultados 


[ 4 . 2 ] 


Aun sin conocer a fondo la probabilidad clasica, se puede estar consciente de que la probabilidad de obtener una 
cara en un solo lanzamiento de una moneda es de la mitad. Esto puede ilustrarse utilizando la formula (4.2) asf: 


P(cara) = 


Numero de formas en las que el evento puede ocurrir 
Numero total de posibles resultados 


2 


Existe s61o una forma en que puede ocurrir el evento (se obtiene una cara), y existen dos posibles resultados (una 
cara y un sello). De igual forma, la probabilidad de sacar un 3 con un dado de seis caras es: 


_ Numero de formas en las que el evento puede ocurrir 1 
Numero total de posibles resultados 6 

Existe sdlo una forma en que puede ocurrir el evento (se saca un 3), y seis posibles resultados. 

La probabilidad clasica implica la determinacion de la probabilidad de algun evento a priori (antes del hecho). 
Por tanto, antes de sacar una carta de una baraja de 52 cartas, se puede determinar que la probabilidad de sacar un 
as es: 


P(as) = 


Numero de formas en las que el evento puede ocurrir 
Numero total de posibles resultados 


_4_ 

52 


Ejercicios de la seccion 


1. ^Cu&l modelo de probabilidad es apropiado para cada uno de los experimentos enumerados a continuation? 
Explique el porque de su respuesta. 

a. El Indice Dow Jones del precio de las acciones hoy cerrara alto. 

b. Una unidad de production sera defectuosa. 

c. Sacar un 6 con un dado. 

d. El sol sera nova. 

2 . Cite tres ejemplos de negocios para cada uno de los tres modelos de probabilidad. 

3 . La siguiente tabla muestra el numero de computadores vendidos diariamente por una tienda minorista. 


Numero de computadores vendidos 

Numero de dias 

0 

12 

1 

43 

2 

18 

3 

20 

4 

25 


Determine la probabilidad de que el numero de computadores que se vendan hoy sea: 

a. 2 

b. Menos de 3 
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c. Mas de 1 

d. Por lo menos 1 

4. Durante los ultimos cuatro campeonatos de futbol norteamericano, el lanzamiento de la moneda cayo cara 
todas las veces. Su entrenador le dice que pedir sello esta vez aumentara la probabilidad de que usted gane 
el lanzamiento. Esta en lo cierto o esta equivocado? Explique su respuesta completamente. 

5. ^Cual modelo de probabilidad utilizo en el problema anterior? Explique. 

6. Durante el ano anterior, las ventas semanales en Petunia’s Pet Shoppe han sido “bajas” durante 16 semanas, 
“considerables” durante 27 semanas y “altas” el resto de las semanas. Cual es la probabilidad de que las 
ventas de esta semana sean: 

a. Considerables 

b. Bajas 

c. Altas 

d. Por lo menos considerables 


4.4 Uniones, intersecciones y relaciones entre eventos 

Un conjunto es toda reunion de objetos. Con frecuencia es de utilidad identificar como pueden relacionarse los 
conjuntos entre si. Se asume que se han identificado dos conjuntos A y B. Cada uno contiene numerosos 
elementos. Es completamente posible que algunos elementos esten en ambos conjuntos. Por ejemplo, se asume 
que el conjunto A consta de todos los estudiantes de la clase de estadistica, y el conjunto B consta de todos los 
estudiantes de la universidad que estan especializandose en economia. Aquellos elementos (estudiantes) que 
estan en ambos conjuntos son los especialistas en economia de la clase de estadistica. Tales estudiantes 
constituyen la interseccion entre A y B. La interseccion entre A y B, que se escribe A n B y se lee como “A 
interseccion B’\ consta de los elementos que son comunes tanto a A como a B. 

Un diagrama de Venn es una herramienta util para mostrar la relation entre conjuntos. Fue desarrollado por 
John Venn (1834 - 1923), un matematico ingles, esta representation grafica se muestra en la figura 4.1. En el 
diagrama pueden verse los dos conjuntos Ay B. Estos son los estudiantes que estan tanto en el conjunto A (la 
clase) como en el conjunto B (especialistas en economia). 


Figura 4.1 

Diagrama 
de Venn 


/t 

(Todos los 
estudiantes de la 
clase) 



B 

(Todos los 
especialistas en 
economia) 


(A n B) ° “A interseccion ZT 
(Especialistas en economia en la clase) 


Interseccion entre A y B Es el conjunto de todos los elementos que estan tanto en 
A como en B. 
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Para que ocurra A n B , tanto “ A como 2?” deben ocurrir. El estudiante debe estar en la clase de estadistica y en 
la especializacion en economia. Los eventos A y B se les denomina eventos no disyuntos. Ambos deben ocurrir 
antes que ocurra el evento Ar\B (“A y B ”). 

La union de A y B, que se escribe A u B y se lee ‘A union B”, consta de tales elementos que estan o en A o en 
B o en ambos. Como se ve en la figura 4.1, todos los estudiantes que estan en la clase (conjunto A), sin tener en 
cuenta su especializacion, y todos los especialistas en economia (conjunto B ), sin tener en cuenta si estan en la 
clase de estadistica, son elementos deAuR 


.La union de A y B Es el conjunto de todos los elementos que estan en A o en B. 


Para que un elemento este en A u B, solo necesita estar en el conjunto A o en el conjunto B o en ambos. 

Una comprension total de la probabilidad no puede adquirirse sin un entendimiento de las formas como 
pueden relacionarse los eventos. Se dice que dos eventos son mutuamente excluyentes si la ocurrencia de uno 
prohibe la ocurrencia del otro. Un ejemplo clasico de eventos mutuamente excluyentes es el de sacar una cara o 
un sello al lanzar una moneda una vez. Si se obtiene una cara, no puede ocurrir un sello. Seleccionar una unidad 
de production y encontrarla defectuosa o no defectuosa son eventos mutuamente excluyentes. 

Sacar una carta de una baraja bien sea una reina o un as tambien son eventos mutuamente excluyentes. Sin 
embargo, sacar una reina y un corazon no lo son, debido a que ambos se presentarfan si se sacara la reina de 
corazones. En el caso inicial a comienzos de este capitulo, la Asociacion Nacional de Esqui va a analizar la 
ubicacion de los centros de esqui. Seleccionar un centro que este (1) en un area aislada y (2) que se encuentre 
ubicado cerca de un centro urbano son eventos mutuamente excluyentes. Si esta aislado, no esta cerca de una 
gran ciudad. Por otro lado, un centro de esqui ubicado (1) cerca de una ciudad y (2) cerca de otros centros 
similares de esqui no son eventos mutuamente excluyentes debido a que hay muchos centros en el area de 
Chicago. 

Los eventos colectivamente exhaustivos constan de todos los posibles resultados de un experimento y 
constituyen su espacio muestral. Los eventos colectivamente exhaustivos de lanzar un dado son 1, 2, 3, 4, 5 y 6. 
Ademas, debido a que existe la certezo de que uno de estos eventos ocurrira, su probabilidad combinada sera 
igual a uno: 

P(lo2o3o4o5o6) = l 

De los 500 empleados de King Dynamics, Inc. 170 estan clasificados como miembros del personal administrativo, 
290 como trabaj adores de linea, y los 40 trabaj adores restantes son empleados auxiliares. Los eventos colectivamente 
exhaustivos son 5, L y A. Si un empleado se selecciona al azar, 

P(S) = 170/500 = 0.34 
P(L) = 290/ 500 = 0.58 
P(A) = 40/500 = 0.08 

Debido a que ocurre la certeza de que el empleado seleccionado provenga de una de estas tres categories 
colectivamente exhaustivas, P(S o L o A) = 0.34 + 0.58 + 0.08 = 1 .00. 

Eventos independientes son eventos en los que la ocurrencia de uno no tiene nada que ver con la ocurrencia 
del otro. Algunos ejemplos incluyen el resultado de un lanzamiento de una moneda y el de un dado. El resultado 
del lanzamiento de una moneda no afecta al dado. Dos lanzamientos de una moneda tambien son eventos 
independientes. 

^Los resultados de sacar dos cartas de una baraja son eventos independientes? Es decir, ^el resultado de sacar 
la primera carta afecta la probabilidad del segundo resultado? Depende de si se reemplaza o no la primera carta 
antes de sacar la segunda. Sea el primer evento sacar una reina y el segundo evento sacar un as. De acuerdo con 
el modelo clasico, la probabilidad de sacar una reina en el primer intento es P(Q) = 4/52. 
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La probabilidad de sacar un as en el segundo intento depende de si la primera carta fue reemplazada antes de 
sacar la segunda. Se asume que una reina, o cualquier otra carta distinta a un as se saca la primera vez. Esa carta 
se mantiene fuera de la baraja en el segundo intento, entonces la probabilidad de sacar un as es P(A) = 4/51 debido 
a que 4 de las 51 cartas restantes son ases. Si la carta se regresa a la baraja antes del segundo intento, la 
probabilidad de sacar un as en el segundo intento es P(A) = 4/52. 

Cuando se saca de un conjunto finito, como por ejemplo una baraja de cartas, dos eventos son independientes 
si y solo si se realiza el reemplazo. Sin embargo, si el primer elemento no se reemplaza antes de sacar el segundo 
elemento, los dos eventos son dependientes. 

Si se seleccionan dos trabajadores de King Dynamics, la probabilidad de que el primero sea un miembro del 
personal administrative es P(S) = 170/500 = 0.34. Si esta selection no se reemplaza, la probabilidad de que la 
segunda sea un trabajador de linea es P(L) = 290/499, y no 290 / 500. 

Eventos complementarios son los eventos en los que si un evento no ocurre, el otro debe ocurrir. Si un evento 
A es lanzar un numero par con un dado (2, 4 o 6), el complemento es lanzar un numero impar (1 , 3, o 5). Si no se 
obtiene un numero par, se debe obtener un numero impar. El complemento de A se escribe como A, y se denomina 
“no A”. 

Claro que los eventos complementarios tambien son colectivamente exhaustivos, porque si A no ocurre, A 
debe ocurrir. Por tanto, 

P(A) + P(A) = 1 

y 

P(A) = 1 - P(A) 

Si no se selecciona un miembro del personal administrativo de King Dyamics, entonces debe ser o uno de linea 
o uno auxiliar. La probabilidad de que sea un miembro del personal administrativo es P(S) y la probabilidad de que 
sea un trabajador de linea o uno auxiliar es P(S). Entonces, P(S) + P(S) = 1 


Ejercicios de la seccion 


7. Dada una baraja de 52 cartas, el conjunto A consta de los 13 corazones y el conjunto B son los cuatro ases. 
Identifique cuales cartas estan incluidas en (A u B) y (A n B ). 

8. Haga un diagrama de Venn para el ejercicio anterior. 

9 . Algunos de los trabajadores hombres y mujeres de una planta grande tienen educacion secundaria. El 
conjunto A consta de los trabajadores hombres, el conjunto B de las trabajadoras mujeres, el conjunto C es 
el conjunto con educacion secundaria, y el conjunto D es el conjunto de los trabajadores que no tienen 
educacion secundaria. Identifique y explique (AuQ,(fiuD)y(AnC). 

10 . Para el problema anterior, ^cual es la diferencia entre (5uD)y(Bn D)? 

11 . Dadas las condiciones del ejercicio 9, identifique los eventos que son: 

a . Mutuamente excluyentes. 

b. Colectivamente exhaustivos con respecto al genero. 

c. Si 300 de los 1000 trabajadores son hombres, ^cual es la probabilidad de que un trabajador sea mujer P(F)1 
^Que papel jugo la regia de la complementariedad en su respuesta? 

d. ^Cual es la diferencia entre P(F) y P(M)1 

12 . Describa tres ejemplos relacionados con los negocios en los cuales los eventos sean independientes. 
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4.5 Tablas de contingencia y tablas de probabilidad 

Las tablas de contingencia y las tablas de probabilidad son utiles al calcular la probabilidad de eventos. Regresando 
al ejemplo de King Dynamics, se supone que la tabla de contingencia para todos los 500 empleados aparece en la 
tabla4.1. 


Tabla 4.1 

Tabla 

de contingencia 
para King 
Dynamics 


Clasificacion de los Empleados 


Genero 

Personal 

Li'nea 

Auxiliar 

Total 

Hombres 

120 

150 

30 

300 

Mujeres 

50 

140 

10 

200 

Total 

170 

290 

40 

500 


La tabla muestra por ejemplo que de los 170 miembros del personal administrativo, 120 son hombres y 50 son 
mujeres. Una tabla de probabilidad puede crearse dividiendo cada una de las entradas de la tabla 4. 1 por el total, 
500 trabaj adores. Los resultados se ven en la tabla 4.2 


Tabla 4.2 

Tabla 

de probabilidad 
para King 
Dynamics 


Clasificacion de Empleados 


Genero 

Personal (S) 

Linea (L) 

Auxiliar (A) 

Total 

Hombres (M) 

120/500=0.24 

150/500=0.30 

30/500=0.06 

300/500=0.60 

Mujeres 

50/500 =0.10 

1 40/500=0.28 

10/500=0.02 

200/500=0.40 

Total 

170/500=0.34 

290/500=0.58 

40/500=0.08 

500/500=1.00 


Los valores en las margenes de la tabla se llaman probabilidades marginales. Por ejemplo, la probabilidad de 
seleccionar un trabajador de linea de manera aleatoria es P(L) = 0.58 y la probabilidad de seleccionar un hombre 
es P(M) = 0.60. Las probabilidades conjuntas en las celdas de la estructura principal de la tabla muestran la 
probabilidad de la intersection entre dos eventos. Por ejemplo, la probabilidad de seleccionar un miembro del 
personal administrativo hombre, es decir, un trabajador que sea parte del personal administrativo y que sea 
hombre, es P(M n S) = 0.24. Una probabilidad marginal se encuentra como la suma de las probabilidades 
conjuntas correspondientes. Por tanto P(M) = P(M n S) + P(M n L)+ P(M n A) = 0.24 + 0.30 + 0.06 = 0.60. 


Ejercicios de la seccion 


13. Usted recolecto datos sobre 500 economistas en la academia, la industria privada, y el gobiemo respecto a 
sus opiniones sobre si la economia podrfa ser estable, podria expandirse o podria entrar en un perfodo de 
contraccion en el futuro proximo. Sin embargo, parte de la information se perdio, resultando la siguiente tabla 
‘ de contingencia parcial. Con base en los datos restantes, cree una tabla de probabilidad. 


Economia 


Economistas 

Estable (S) 

Expansion (E) 

Contraccion (C) 

Total 

Academia (A) 

125 


100 


Industria privada (1) 

35 


110 

Gobierno (G) 

25 

40 


65 

Total 

200 
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De la tabla de probabilidad halle: 

a. P(A) 

b. P(G). 

c. P(AnS) 

d. P(AnE) 

e. P(G n Q. 

14 . La revista Forbes (febrero de 1997) clasifico las 120 ciudades de Estados Unidos de acuerdo con la calidad de 
vida, con base en parte del porcentaje de empleados que tenian titulo universitario. Los resultados se ven en 
la siguiente tabla de contingencia parcial, en donde A es menos del 15% con titulo universitario, B es del 15 
al 20% con titulo universitario y C es m£s del 20% con titulo universitario. Realice una tabla de probabilidad 
y responda las preguntas que se presentan en la siguiente tabla. 


Porcentajes con 
Titulo Universitario 

Calidad de Vida 


Total 

Pobre (P) 

Bueno (G) 

Excelente (E) 

4 

10 

20 


40 

B 



20 


C 


10 


20 

Total 

20 

60 




a. iP(A)l 
F iP(Pr\B )? 

c. ^nQ? 

d. iP(AnG )? 

15 . Con base en su tabla de probabilidad del ejercicio anterior, escriba un informe al presidente del comite para 
seleccionar un nuevo sitio para las oficinas principales de la compama. Incluya y evalue todas las 
comparaciones relevantes, con base en los factores porcentuales /de calidad. ^Que conclusion saca? 


4.6 Probabilidad condicional 

Con frecuencia se desea determinar la probabilidad de algun evento, dado que antes otro evento ya haya ocurrido. 
Logicamente, esta es llamada probabilidad condicional. Se denota como P(A \ B) y se lee la “probabilidad de A 
dado ZT. 


Probabilidad condicional Es la probabilidad de que el evento A ocurra, dado que o a 
condicion de que el evento B ya haya ocurrido. 


La probabilidad condicional se utiliza comunmente en el planteamiento de un negocio para revisar la 
probabilidad de algun evento dado sobre el cual se ha recolectado informacion adicional. Por ejemplo, se puede 
estimar la probabilidad de que se haga una venta ( S ) a un cliente antiguo de P(S ) = 0.80. Sin embargo, si se sabe 
posteriormente que este cliente ahora esta comprando a alguien de la competencia, se puede revisar la probabilidad 
de que se haga una venta, dado que el competidor (C) ha presentado una oferta P(S I C) = 0.30. 
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Para ilustrar con un ejemplo simple, ya se sabe que la probabilidad de sacar una jota de una baraja de 52 cartas 
es P(J) = 4/52 debido a que hay 4 jotas en una baraja. Sin embargo, es de suponer que se desea saber la 
probabilidad de que la carta sacada fuese una jota, dada la information adicional de que es una figura (F). Es decir, 
P(J |F)-Yaque4delas 12 figurasde una baraja son jotas, P(J I F). =4/12, y no 4/52. Estaes la formula general para 
la probabilidad condicional del evento A, dado que se conoce que el evento B ya ha ocurrido: 


Probabilidad condicional 

P(A | B) = P(A p B) 

P(A)P(B | A) 

[4.3] 

de A dado B 

1 P(B) 

P{B) 



Por tanto, 


P{J\F) = 


p(j n f) 

P{F) 


fW(F\j) 

P(F) 


(4/52)(l) 
" 12/52 


= 4/12 


P(F I J) es 1 debido a que todas las jotas son figuras. Aunque en este ejemplo simple fue posible determinar P(J 
I F) sin el uso de la formula (4.3), existen muchos ejemplos en los cuales la formula es necesaria. Para ilustrar el 
valor de la formula (4.3), se retoma por un momento la tabla 4.2 para King Dynamics. Se puede observar que la 
probabilidad de que un trabajador tornado aleatoriamente sea hombre es P(M) = 0.60. Sin embargo, si se desea 
calcular la probabilidad de que el trabajador sea hombre dado que es un miembro del personal administrativo 
P(M I S) se puede hallar asi 


P(M\S) = 


P(M n S ) 
P(S ) 


0.24 

0.34 


= 0.71 


Ejercicios de la seceion 


16. De la tabla de probabilidad que usted creo en el ejercicio 13: 

a. Halle P(S\A). 

b. Si usted es un economista academico, £es mas probable que pronostique una economia estable que si 
trabaja con el gobiemo? 

c. Dado que usted trabaja en la industria privada, ^es mas probable que usted pronostique una contraction 
en la economia que un academico? 

d . Si usted trabaja para el gobiemo, ^cual de los tres pronosticos es mas probable que usted haga? 

17. Con base en la tabla de probabilidad que usted creo en el ejercicio 14, 

a . Dando un rango de Excelente, ^cual de las tres categorfas porcentuales es mas probable que ocurra? 

b. Si el 19% de los empleados de una ciudad tienen tftulo universitario, ^es mas probable que la calidad de 
vida se clasifique en Pobre, Buena o Excelente? 

c. Si mas del 20% de los empleados de una ciudad tienen titulo, ^que tan probable es que la ciudad sea 
clasificada como Excelente? 

d. Si una ciudad es clasificada como Excelente, ^que tan probable es que mas del 20% de sus empleados 
tengan titulos universitarios? 
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4.7 Las dos reglas de la probabilidad 

Existen dos reglas basicas que deben seguirse para calcular la probabilidad de eventos mas complejos: la regia de 
la multiplicacion y la regia de la adicion. Cada una se utiliza para propositos especfficos. La regia de la multiplicacion 
se utiliza para determinar la probabilidad de que “A y B'\ P(A n B), y la regia de la adicion se utiliza para calcular 
la probabilidad de “A o B'\ P(A u B). 


A. Regia de la multiplicacion 

El proposito de la regia de la multiplicacion es determinar la probabilidad del evento conjunto P(A n B). Es decir, 
que para encontrar la probabilidad de “A y B ”, simplemente se multiplican sus respectivas probabilidades. El 
procedimiento exacto depende de si A y B son dependientes o independientes. Los eventos A y B son 
independientes si P(A) = P(A I B). Es decir, la probabilidad de A es la misma bien se considere o no el evento B . De 
igual forma, si A y B son independientes, si P(B) = P(B | A). 

Para eventos independientes la probabilidad de dos eventos se vuelve: 


Probabilidad de eventos P(AnB) = P(A)XP(B) [4.4] 

independientes 


La probabilidad de los dos eventos independientes de sacar un 3 con un dado y una cara con una moneda es 

P(3 nH) = P( 3) X P(H) = 1/6) X (1/2) =1/12 

Debido a que estos dos eventos son independientes, simplemente se multiplican sus probabilidades individuates. 
De igual forma, la probabilidad de sacar una carta de las 13 cartas de corazones de una baraja de 52 cartas y de 
sacar un numero par con un dado es P(H n E) = P(H) X P(E) = 13/52 X 3/6 = 39 / 312. 

Para atraer a los clientes, Norman, propietario de Bates Motel, ha modemizado sus instalaciones. Observa que 
el 20% de todos los autos que pasan por alii, se detienen para alquilar un cuarto. ^Cual es la probabilidad de que 
los proximos dos carros se detengan? Asumiendo que estos eventos son independientes, P(S l n S 2 ) = P(S X ) x 
P(S 2 ) = (0.20)(0.20) =0.04 La probabilidad de que los dos proximos autos alquilen un cuarto a Norman es del 4%. 
^Cual es la probabilidad de que el primer auto pare y que el segundo no lo haga? P(S { n S 2 ) = P(S) x P(S 2 ) = (0.20) 
X (0.80) = 0.16. 

Si los eventos son dependientes, entonces, por definicion, se debe considerar el primer evento al determinar la 
probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condicion que A ya haya ocurrido. 
Se necesita del principio de probabilidad condicional. La probabilidad de los eventos conjuntos A y B es 


Probabilidad de eventos 
dependientes 


P(AnB) = P(A)XP(B\A) 


[4.5] 


Regresando a la tabla de probabilidad para King Dynamics, tabla 4.2, se observa que la probabilidad marginal 
de la primera fila muestra claramente que P(M) = 0.60 sin considerar si el trabajador es miembro administrativo, de 
linea o auxiliar. Sin embargo, la probabilidad conjunta de que sea hombre y miembro administrativo se observa 
como P(M n 5) = 0.24. 

Tambien se puede calcular esta probabilidad utilizando la formula (4.5); P (M n S) = P(M) X P(S I M). El ultimo 
termino es probabilidad condicional, la cual se determino anteriormente como 
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Entonces, 


P(S\M) = 


P(S Q M) 
PiM) 


0.24 

0.60 


0.40 


PiM ns)* PiM) X PiS | M) = (0.60) X (0.40) = 0.24 

Aunque el uso de una tabla puede simplificar los calculos de probabilidad, existen ejemplos en los cuales es 
muy dificil la creation de una tabla, por tanto se requiere el uso de formulas. El ejemplo 4.1 ilustra este caso. 


Ejemplo 4.1 

El gerente de creditos de Dollar- Wise Department Store recolecta datos sobre 100 de sus clientes. 
De los 60 hombres, 40 tienen tarjetas de credito (C ). De las 40 mujeres, 30 tienen tarjeta de credito 
( C). Diez de los hombres tienen saldos vencidos (B), mientras que 15 de las mujeres tienen saldos 
vencidos (B). El gerente de credito desea determinar la probabilidad de que un cliente seleccionado 
al azar sea: 

a. Una mujer con tarjeta de credito. 

b . Una mujer con un saldo. 

c. Un hombre sin un saldo. 

d . Un hombre con un saldo. 


Solution 

Crear una tabla de probabilidad es dificil ya que existen tres factores: genero, tarjeta de credito y 

saldo en la tarjeta. El uso de la formula (4.5) es quiza el modelo preferido. 

a . PiW nC) = P(W) xP(C I W). Claramente P(W) = 40/100. Ademas, de las 40 mujeres 30 tienen 
tarjetas de credito. Por tanto, dado que el cliente es una mujer, la probabilidad de que tenga una 
tarjeta de credito es P(C I W) = 30/40. Entonces, P(WnC) = P(W) x P(C I W) = (40/100) X (30/ 
40) = 0.30 

b. P{ Wn B) = P(W) xP(B I W). De las 40 mujeres, 1 5 tienen saldos. Dado que el cliente es una mujer, 
la probabilidad de que tenga un saldo es de 15/40. De manera que P{W n B) = P(W) x P(B I W) 
= (40/100)(15/40) = 0.15. 

c. P(M r\B) = P(M) x P(B I M). Debido a que 50 de los 60 hombres no tienen saldos, P(B I M) = 
50/60. Entonces, P(MnB) = P(M) xP(B \M) = (60/1 00) (50/60) = 0.50. 

d. P(Mr\B) = P(M)xP(B \M). Delos 60 hombres, 10 tienen saldos. P(B \M) = 10/60. Asi,P(Mn 
B)~P(M)xP(B | M) = (60/100)(10/60) = 0.10. 


Interpretacion 

Pueden determinarse las probabilidades de otros eventos conjuntos que ayudarfan al gerente de 
credito a determinar las polfticas de la tienda y a incrementar las ventas. 


B. Regia de la adicion 

La regia de la adicion se utiliza para determinar la probabilidad de A o B, P(A u B). 
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La probabilidad del evento A 
o B (cuando los eventos 

P (A u B) = P (A ) + P(B) - P (A n B) 

[4.6] 

no son mutuamente excluyentes) 




Vale la pena recordar que los eventos Ay B no son mutuamente excluyentes si ambos pueden ocurrir al mismo 
tiempo. En este caso, la formula requiere que se reste la probabilidad del evento conjunto A y B. La probabilidad 
de sacar un as o una de las 13 cartas de corazones de una baraja es P(A ) + P(H) - P(A n H). Los eventos Ay H 
no son mutuamente excluyentes, debido a que ambos ocurren si se sacara el as de corazones. Por tanto, P(A) + 
P(H) -P(AnH)- (4/52) + (13/52) - (1/52) = 16/52. 

La razon por la cual se debe restar la probabilidad conjunta cuando los eventos son mutuamente excluyentes 
es para evitar el doble conteo . Cuando se cuentan los cuatro ases, se incluye el as de corazones. Cuando se 
cuentan las trece cartas de corazones se incluye el as de corazones por segunda vez. Debido a que solo hay un as 
de corazones, es necesario restarlo una vez. 

En el ejemplo de King Dynamics, la probabilidad de que un empleado sea un trabajador hombre o un trabajador 
administrativo es P(M) + P(S)-P(M nS) = (0.60) + (0.34) - (0.24) = 0.70. De nuevo, se debe restar la probabilidad 
conjunta P(M n 5), debido a que se incluyeron trabajadores administrativos al contarse todos los hombres y se 
incluyeron hombres al contar todos los trabajadores administrativos. Los trabajadores administrativos hombres 
se contaron dos veces. 


Ejemplo 4.2 

La mayorfa de las estaciones de servicio venden tres tipos de gasolina: corriente, super y premium. 
Con frecuencia, alguna de cada tipo esta enriquecida con etanol. La tabla de contingencia que se 
muestra a continuation ilustra los porcentajes de clientes que prefieren cada tipo. 



Corriente (R) 

Super (S) 

Premium (P) 

Total 

Etanol 

0.05 

0.10 

0.05 

0.20 

Sin etanol 

0.15 

0.40 

0.25 

0.80 

Total 

0.20 

0.50 

0.30 

1.00 


Determine la probabilidad de que el siguiente cliente prefiera: 

a. Corriente o etanol; P(R u E). 

b. Super o sin etanol; P(S u E). 

c. Premium o etanol; P(P u E). 

d. Premium o sin etanol; P(PuZT). 

a. P(R U E) = P(R) + P(E) - P(R H E) 

= 0.20 + 0.20 - 0.05 = 0.35 

b. P(S U£) = P(S) + P(E) ~ P(S H E) 

= 0.50 + 0.80 - 0.40 = 0,90 

c. P(P U E) = P(P) + P(E) - P(P n E) 

= 0.30 + 0.20 - 0.05 = 0.45 

d. P(P UE)~ P(P) + (PE) - P(P H E) 

= 0.30 + 0.80 - 0.25 = 0.85 


Solucion 
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Interpretation 

Otras probabilidades podrian determinarse para comparar la popularidad de las preferencias del 
consumidor y asi formular un programa de mercadeo disenado para incrementar las ventas globales. 


Vale la pena recordar que los ejemplos anteriores se relacionan con dos eventos que no son mutuamente 
excluyentes. Si A y B son mutuamente excluyentes, P (A n B) = 0. Por definition no pueden ocurrir simultaneamente. 
Debido a que no tiene sentido restar cero, la formula (4.6) se reduce a 


Probabilidad del evento A 



o del evento B (cuando los 

P(AKJB) = P(A) + P(B) 

[4.7] 

eventos son mutuamente 
excluyentes 



La probabilidad de que un cliente prefiera corriente o super (eventos mutuamente excluyentes debido a que no 
puede preferir ambas) es P(R u S) = P(R ) + P(S ) = 0.20 + 0.50 = 0.70. 


Algunos casos pueden necesitar el uso tanto de la regia de la multiplicacion como la de la adicion. Se supone 
que se lanza una moneda tres veces y se desea determinar la probabilidad de que se obtengan dos caras. La 
pregunta es £como puede suceder el evento (2 de 3 sean caras)? Se pueden obtener dos caras si: 


Solo el tercer lanzamiento es sello 
S61o si el segundo lanzamiento es sello 
S61o si el primer lanzamiento es sello 
con H: cara, T: sello 


P(H l y H 2 y r 3 ) = 1/2 X 1/2 X 1/2 = 1/8 

P(//, y T 2 y // 3 ) = 1/2 X 1/2 X 1/2 = 1/8 

P(Tr y H 2 y // 3 ) = 1/2 X 1/2 X1/2 = V| 


Debido a que el evento puede suceder de la primera, de la segunda o de la tercera forma, se deben sumar sus 
respectivas probabilidades. Asf, la probabilidad de que los tres lanzamientos de la moneda produzcan dos caras 
es de 3/8. El ejemplo 4.3 ilustra esto de manera mas completa. 


Ejemplo 4.3 

De los 10 chips de un computador, 4 estan defectuosos. ^Cual es la probabilidad de seleccionar 3 
sin que haya reemplazo, de los cuales solo uno sea defectuoso? 


Solution 

Usted debe preguntarse, “^Como puede ocurrir el evento?” Existen tres formas en las cuales solo 
uno puede ser defectuoso: (1) solo el primero es defectuoso, (2) solo el segundo es defectuoso, y 
(3) solo el ultimo es defectuoso. De acuerdo con la regia de la multiplicacion, 

La primera forma es p(D l H D 2 D D 3 ) = (4/10)(6/9)(5/8) = 120/720. 

La segunda forma es P(D l n D 2 n D 3 ) = (6/10)(4/9)(5/8) = 120/720. 

La ultima forma es (D l n D 2 n D 3 ) = (6/10)(5/9)(4/8) = 120/720. 

Debido a que el evento “solo uno es defectuoso” puede suceder de la primera forma, la segunda 
forma o la tercera forma, se debe adicionar las tres probabilidades, de acuerdo con la regia de la 
adicion. P(solo uno es defectuoso) = 120/720 + 120/720 + 120/720 = 360/720 = 0.50 
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Interpretation 

Muchas companias basan las garantias de sus productos en la probabilidad de que un cierto 
numero de unidades vendidas salgan defectuosas. Si esta probabilidad es demasiado alta y costosa, 
las compamas se veran forzadas a ofrecer garantias menos atractivas. 


Ejercicios de la seccion 


18 . Con base en la tabla de probabilidad del ejercicio 13, halle 

a. P(A U SI 

b. p(p u cy 

c . P(E U G). 

d. P(GUE). 

e. P(A U G), 

19 . Wally, propietario de Wally’s Workout World, desea construir un perfil de miembros para desarrollar una 
campana publicitaria que atraiga a clientes potenciales tipicos de quienes actualmente prefieren este gimnasio. 
El 30% de los miembros actuales son mujeres, el 80% de ellas es menor de 30 anos. El 60% de los hombres son 
menores de 30 anos. Cual es la probabilidad de que un miembro seleccionado de manera aleatoria sea: 

a. ^Una mujer menor de 30 anos? 

b. ^Una mujer mayor de 30 anos? 

c. ^Un hombre mayor de 30 anos o una mujer menor de 30? 

d. ^Mayor de 30 anos? 

e. ^Un hombre o una mujer mayor de 30 anos? 

20 . De 1,000 jovenes de 18 anos, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres, 500 tienen 
trabajo. Cual es la probabilidad de que un joven de 18 anos tornado aleatoriamente sea: 

a. ^Un bachiller empleado? 

b. ^Empleado pero no bachiller? 

c. ^Desempleado o un bachiller? 

d. ^Desempleado o no bachiller? 

21 . Sammy’s Sweat Shop vende dos tipos de zapatos para correr, los Mercury y los Racer. Las probabilidades de 
que un cliente dado compre los Mercury es de P(M) - 0.40 y la probabilidad de que compre los Racer es de 
P(R ) = 0.30. La probabilidad de que compre ambos es P(B) = 0. 10. ^Cual es la probabilidad de que un cliente 
compre oMoRl 

22 . Un corredor de bolsa sabe por experiencias anteriores que la probabilidad de que un cliente compre acciones 
es del 65%. La probabilidad de que el cliente compre un bono del gobiemo si ya tiene acciones es del 35%. 

a. ^Cual es la probabilidad de que el cliente posea ambos? 

b . ^Son By S independientes? Explique. 


4.8 Teorema de Bayes 

El reverendo Thomas Bayes (1702-1761) desarrolld un concepto util al calcular ciertas probabilidades. Se asume 
que Dunham Manufacturing utiliza dos maquinas para producir su producto. La maquina A produce el 60% de la 
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produccion total, y la maquina B produce el restante 40%. El 2% de las unidades producidas por A son defectuosas, 
mientras que B tiene una tasa de defectos del 4%. 

Esto se muestra en el diagrama de arbol que acompana la figura 4.2. Se asume que una unidad de produccion 
se selecciona aleatoriamente. El primer conjunto de “ramas” en el arbol que indica cual maquina produjo la unidad, 
muestra que la probabilidad de que provenga de la maquina A es P(A) = 0.60 y que la probabilidad de que 
provenga de la maquina B es P(B ) = 40. El segundo grupo de ramas que indica la calidad de la unidad dice que si 
provino de la maquina A puede ser o defectuosa o no defectuosa. Estas probabilidades condicionales demuestran 
que la probabilidad de que no sea defectuosa dado que provino de la maquina A es P(D I A ) = 0.98 y la 
probabilidad de que sea defectuosa dado que proviene de A es P{D/A) = 0.02. Las probabilidades condicionales 
para B revelan que la probabilidad de que no sea defectuosa dado que provino de B es P(D I B) = 0.96 y la 
probabilidad de que sea defectuosa con base en la condicion de que provino de B es P(D | B) = 0.04. 


Figura 4.2 

Diagrama de arbol 
para Dunham 
Manufacturing 



P(A no ) = P(A) X P(D\A) = (0.60X0.98) 
= 0.588 


P(A n D) = P(A) X P(D\A) = (0.60X0.02) 
= 0.012 


P(B n D) = P{B) X P(D\B) = (0.40)(0.96) 
= 0.384 


P(B n D) = P(B) X P(D\B) = (0.40X0.04) 
= 0.016 


Finalmente, se observa que hay cuatro posibles resultados para el experimento de seleccionar una unidad de 
produccion. La probabilidad de cada uno se calcula multiplicando las probabilidades sobre cada una de las ramas 
que conllevan a ella. Para ilustrarlo, el primer posible resultado es que la unidad provenga de A y que no sea 
defectuosa, P(A n D). Utilizando la regia de la multiplication, P(A n Z5) = P(A) x P(D I A) = (0.60)(0.98) =0.588. Las 
probabilidades de los tres resultados restantes pueden determinarse de forma similar. 

Se puede observar directamente en la figura 4.2 que P(A) = 0.60. Suponiendo que la unidad es defectuosa, se 
desea saber la probabilidad de que la unidad provino de la maquina A. Con esta information adicional, se puede 
revisar la probabilidad de que la unidad fue producida por la maquina A. Ah ora se desea determinar P(A I £>, no 
sdlo P(A). 

Vale la pena recordar la regia de la probabilidad condicional: 

ffo no) P(A) X p(d | A) 

,w " |s W — rn — 

Sin embargo, P(D ) no es discernible de inmediato. Aqui es donde participa el teorema de Bayes. Existen dos 
formas en las cuales la unidad puede ser defectuosa. Puede provenir de la maquina A y ser defectuosa, o puede 
provenir de la maquina B y ser defectuosa. Utilizando la regia de la adicion, 

P(D) = P(A n D) + P(B n D) 

= P(A) X P{D\A) + P(B ) X P{D | B) 

Cuando se hace la sustitucion en el denominador de la formula de la probabilidad condicional anterior para P(D ), 
el teorema de Bayes dice 
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MM ID). nAnD) 

Vj '■ } P(A n d) + P(B n D) 

[4.8] 

Teorema de Bayes 

P{A) X P{D\A) 

P(A) X P{D 1 A) + P(B) X P(D 1 B) 



Ahora se puede hallar P(A I D) 


P(A | D) 


p{a n d) 

P(D) 

p(a n p) 

p(a n d) + p(b n d) 
( 0 . 012 ) 

(0.012) + (0.016) 


= 0.429 


Mientras que P(A) = 0.60 , P(A I D) = 0.429. Se nota que P(A | D) < P(A) debido a que la maquina A produce un 
porcentaje menor de defectos que la maquina B. 


Ejemplo 4.4 Teorema de Bayes 

El departamento de personal de una empresa grande ha descubierto que solo el 60% de los candidatos 
entrevistados estan realmente calificados (Q) para asumir un cargo en la compama. Una revision de 
los registros de la firma muestra que quienes estaban calificados, el 67% tuvo un entrenamiento 
previo en estadfstica (7), mientras que el 20% de quienes no estaban calificados habfan recibido 
instruction estadfstica mucho antes. Es decir, 

P(Q) = 0.60 P(T | Q) = 0.67 P(T\ Q) = 0.20 

El director de personal puede ver claramente que dado que usted esta calificado, es mas probable 
que usted tenga algo de capacitacion en estadfstica que si no esta calificado (0.67 > 0.20). Se perdio 
mucho tiempo entrevistando a los candidatos que resultaron no calificados; sin embargo, el director 
esta considerando conceder entrevistas solo a aquellos candidatos que tengan capacitacion en 
estadfstica. El espera incrementar la probabilidad de encontrar candidatos calificados para ocupar 
el cargo. La pregunta entonces serfa, ^es mas probable que usted este calificado dado que ha tenido 
capacitacion: P(Q I T)? Si es asf, el departamento de personal podrfa evitar demoras y costos 
innecesarios restringiendo las entrevista solo a aquellos candidatos que tengan capacitacion en 
analisis estadfstico. 


Solution 

Utilizando la regia de probabilidad condicional 

Pin I T\ . P(Q n T) « *(T\Q) = (0.60) X (.067) 

p{J) p(T) p(T) 

Debido a que los registros de la companfa no proporcionan P(T), se debe utilizar el teorema de 
Bayes para hallar el denominador. Existen dos formas en las que un candidato puede tener 
entrenamiento previo: (1) el candidato puede estar calificado y tener capacitacion, P(Q n 7), y (2) 
el candidato puede no estar calificado y tener entrenamiento P(QnT). Por tanto, 
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p(t) = p(q n t) + p(g n t) 

= />(e) x p(r|(2) + />(e) x p(rie) 

= (0.60X0.67) + (0.40X0.20) 

= 0.482 

Entonces 

/>(|r) = (060X067) 

0.482 
= (0.834) 

Puesto que P(Q) = 0.60, P(Q I T) = 0.834 

Interpretation 

Para aumentar la probabilidad de entrevistar solo candidatos calificados, el departamento de personal 
deberia entrevistar solamente a los candidatos que tienen capacitacion en analisis estadistico. 


Ejercicios de la seccion 


23 . James Business Equipment vende una amplia gama de suministros de oficina en la region central de Estados 
Unidos. El gerente de ventas cree que ha descubierto una tendencia que podrfa disparar las ventas. Los 
resultados de un estudio parecen sugerir que las firmas jurfdicas estan mas inclinadas a hacer pedidos que 
otras con otras areas de negocios. Sus datos muestran que la probabilidad de que la comunidad de comercio 
general compre sus suministros es del 20%, P(B ) = 0.20. Entre otros clientes durante varios de los ultimos 
meses, el 50% eran empresas jurfdicas. El gerente siente que concentrarse en las oficinas jurfdicas incrementara 
la probabilidad de que una llamada al departamento de ventas termine en una compra. ^Cual es su conclusion? 

24 . Una empresa productora de medicinas que esta probando un nuevo medicamento contra la fiebre del heno 
descubrio que el 60% de todas las personas que sufren de este mal sienten alivio de los smtomas a las 4 
semanas, hayan o no utilizado el medicamento. De quienes sienten alivio, el 40% ha tornado el medicamento, 
mientras que el 30% de quienes no han sentido alivio han probado el medicamento. La empresa productora de 
medicinas desea determinar si es aconsejable tomar el medicamento comparando la probabilidad de aliviarse 
de la fiebre del heno si quienes la padecen si toman el medicamento con la probabilidad de alivio si quienes 
la padecen no toman el medicamento. 


4.9 Tecnicas de conteo 

Muchas decisiones comerciales requieren que se cuente el numero de subconjuntos que se pueden obtener de un 
conjunto. De las ventas de una linea que consta de 10 productos, ^cuantos subconjuntos de 3 productos se 
pueden ofrecer a los clientes? Siete agentes de ventas estan en un concurso para ver quien gana un viaje gratis 
a Cancun. ^Cuantas ordenes diferentes de termination hay? ^Cuantos numeros telefonicos distintos pueden 
asignarse a una oficina grande dados los digitos 0-9? Muchos otros ejemplos abundan. Se analizaran cuatro 
tecnicas de conteo utilizadas para responder estas preguntas y otras parecidas: combinaciones, permutaciones, 
escogencia multiple y multiplication. 

Al seleccionar los elementos en los subconjuntos, la distincion entre pemutaciones y combinaciones depende 
de si el orden de las selecciones hace la diferencia. Si un orden es suficiente para constituir otro subconjunto, 
entonces se trata de permutaciones. Si dos subconjuntos se consideran iguales debido a que simplemente se han 
reordenado los mismos elementos, entonces se involucran las combinaciones. 
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De la lista de las primeras cinco letras del alfabeto A, B, C, D y E, ^cuantos subconjuntos diferentes se pueden 
obtener? Dos posibilidades son {A, B ,C) y {A,C,B}. Ambos tienen los mismos elementos y difieren solo en el 
orden en el cual se seleccionaron los elementos. Si se considera que dos subconjuntos son diferentes porque el 
orden es diferente, se consideran como permutaciones. Si se considera que dos subconjuntos son identicos y 
constituyen el mismo subconjunto porque ambos tienen los mismos elementos sin considerar el orden, son 
denominados combinaciones. Es decir, que con las permutaciones el orden es el que hace la diferencia. 

Dado un conjunto de n elementos, el numero de permutaciones, cada uno de tamano r, se determina como 


El numero de permutaciones de 
n elementos tornados r a la vez 


[4.9] 


en donde n\ se lee como factorial” y significa el producto de todos los numeros de 1 a n. Por tanto 4! = 1 X 2 
X 3 X 4 = 24. Por definicion 0! = 1 

El numero de combinaciones de n elementos tornados r a la vez es 


El numero de combinaciones c _ . 

de n elementos tornados r a la vez " r!{n-r)t 


[4.10] 


Antes se pregunto que dados 10 productos, ^cuantos subconjuntos de 3 productos podrfan empacarse 
juntos y ofrecerse a los clientes? Si se considera que el orden en el cual se ofrecen los 3 productos no influira en 
los clientes, es decir, que el orden no hara diferencia alguna, se debe hallar el numero de combinaciones de 10 
elementos tornados 3 a la vez. 



10! 

31 ( 10 - 3 !) 

120 


Hay 120 paquetes de 3 artfculos que se pueden ofrecer a los clientes. 

Las combinaciones tambien pueden utilizarse para calcular la probabilidad de que uno de los chips de 
computador del ejemplo 4.3 sea defectuoso. En lugar de determinar la probabilidad de cada forma en la cual uno 
sea defectuoso, simplemente se halla la probabilidad de que una de las formas tenga un chip defectuoso: P(D ] n 
Z > 2 n D 3 ) = 120/720. Entonces se cuenta el numero de formas en las cuales uno de los tres es defectuoso como 
= 3, y se multiplica: (3)(1 20/720) = 0.50. 


Ejemplo 4.5 

Un caso reciente en la corte del condado de Madison, Kentucky, sobre las practicas de contratacion 
de una compama de telefonos local. La compama planeo contratar 3 nuevos empleados. Habia 8 
candidatos para los cargos, 6 de los cuales eran hombres. Los 3 que fueron contratados eran 
hombres. Un cargo por discriminacion de sexo se impuso contra la compama. ^Como decidina 
usted? 


Solucion 

La decision depende ampliamente de la probabilidad de que todos los 3 contratados sean hombres 
si a cada candidato se le da igual consideracion sin tener preferences de genero. Por tanto, se debe 
determinar la probabilidad de que todos los 3 sean hombres. 
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Numero de formas en las cuales todos 3 pueden ser hombres 
P(to os om res) - Numero total de posibles resultados 

El numero de formas en las cuales 3 de los 6 hombres y ninguna de las 2 mujeres pueda ser 
contratada es 6 C 3 X 2 C 0 = 20 X 1 = 20. El numero total de formas en las que 3 de todos los 8 
candidatos pueden ser contratado es g C 3 = 56. Asi 

20 

P(todos 3 son hombres) = — = 36% 

56 


Interpretation 

Existe el 36% de probabilidades de que los 3 empleados contratados sean hombres si no se da 
ninguna preferencia al genero. Este evento ocurrirfa aproximadamente una de cada 3 veces. La corte 
regulo que todo evento que pudiera ocurrir con tal frecuencia es usual y no constituye prueba que 
vaya mas alia de una duda razonable. El cargo de discrimination no se mantuvo. 


Regresando al problema para determinar de cuantas formas podrfan empacarse 3 de los 10 productos, si la 
investigation sugirio que el orden en el cual se empacaran los 3 productos afectarfa las ventas, se deberfa 
determinar el numero de permutaciones de los 10 elementos tornados 3 a la vez. 

P , 1Q! 

10 3 (10 - 3!) 

= 720 

Dados los valores deny r, P r > C r debido a que se pueden obtener otras permutaciones tan s61o cambiando el 
orden. 

El numero de ordenes terminadas de los siete agentes de ventas que compiten por el viaje a Cancun nombrados 
anteriormente es 1 P 1 =5,040. Hay 5,040 formas distintas en las cuales esas siete personas pueden clasificarse u 
ordenarse de acuerdo con sus registros de ventas. Si el gerente de ventas va a recompensar a tres miembros de su 
equipo de ventas con un viaje y el orden de terminacion es importante porque cada uno tiene un porcentaje 
diferente del viaje por el cual se paga, se tiene que 7 P } = 210. Por otro lado, si los tres ganaran el mismo viaje y el 
orden no hiciera diferencia alguna, entonces se tendrfa 7 C 3 = 35. 

Ni las permutaciones ni las combinaciones permiten que se seleccione un elemento mas de una vez. Si se 
permite la duplicacion, se utilizarfa el metodo de escogencia multiple de conteo. El numero de arreglos de escogencia 
multiple de n elementos tornados r a la vez es M r = n r . 

La pregunta anterior respecto al numero de lrneas telefonicas en una oficina grande requiere del modelo de 
escogencia multiple, debido a que cada uno de los 10 dfgitos puede utilizarse mas de una vez. Si la oficina utiliza 
solo una extension seguida por cuatro dfgitos, tales como 555-XXXX, el numero de lrneas telefonicas es l0 M 4 = 10 4 
= 10,000. Si se utiliza una segunda extension, como 556-XXXX. ( 10 M 4 )(2), o 20,000 lrneas son posibles. 

En todos los casos anteriores, la seleccion se hizo de un solo conjunto. Los numeros telefonicos provinieron 
de un solo conjunto de 10 elementos. Si debemos escoger un elemento de dos o mds conjuntos, es adecuado el 
proceso de multiplicacion. Este principio requiere que simplemente se multiplique el numero de elementos en 
cada conjunto. George intenta comprar un nuevo autom6vil para sus vacaciones en Piney Flats. Puede escoger 
entre tres colores, dos tamanos de motor y cuatro disenos de interior distintos. ^Cudntos modos distintos de 
transporte estan a disposici6n de George? De acuerdo con el principio de multiplicaci6n, debido a que tres 
conjuntos contienen tres elementos, dos elementos y cuatro elementos respectivamente, George debe decidir 
entre 3 X 2 X 4 = 24 formas distintas de llegar a su destino. 
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Ejercicios de la seccion 


25. De los 15 miembros de la junta directi va de una gran empresa, ^cuantos comites de 5 miembros pueden 
seleccionarse si el orden no importa? 

26. De los 10 ejecutivos, 3 van a ser seleccionados para que sirvan como presidente, vicepresidente y tesorero. 
^Cuantas selecciones distintas son posibles? 

27. Sus dos companeros de cuarto estan enfermos y a usted lo envian a un centro estudiantil para llevar comida 
a cada uno de ellos. Si usted debe escoger entre cinco selecciones, <,en cuantas formas puede alimentar a sus 
companeros? (Pista: £el orden hace la diferencia? ^puede repetir?). 

28. Como ingeniero constructor de Base Electronics, usted debe determinar ^cuantos reproductores de CD 
puede ensamblar de tal forma que tengan un sistema de parlantes, un tocadiscos y un mecanismo de 
sintonizacion si usted puede escoger entre 3 sistemas distintos de parlantes, 4 de tocadiscos y 2 de 
sintonizacion? 

29. De los 12 empleados de Worldwide Travel Services, 7 han tenido capacitacion especial. Si 5 empleados van 
a ser enviados a Europa, ^cual es la probabilidad de que 3 esten dentro de los que han tenido entrenamiento 
especial? 


Problemas resueltos 

1. Probabilidades basicas Ortez Exports, con sede en Brasil, envia productos de came congelada a clientes en 
Norteamerica (A/), Europa (E) y Asia (A). Los paquetes protectores son o de lujo (D) o estandar (S). La 
siguiente tabla de probabilidad muestra las frecuencias relativas de muchos de los envios mas recientes. 



Europa 

Norteamerica 

Asia 

Total 

De lujo 

0.083 

0.167 

0.167 

0.417 

Estandar 

0.167 

0.167 

0.250 

0.584 

Total 

0.250 

0.334 

0.417 

1.000 


Para finalizar la toma de decisiones de varios negocios pendientes, el Sr. Ortez determina la probabilidad de 
hacer envios a tres destinos con cualquiera de las dos opciones de empaque. 

a. De lujo para Europa = P(D n E) = 0.083, como se ve en la primera celda que muestra la probabilidad de los 
dos eventos de lujo y Europa. 

b. ifis mas probable que el Sr. Ortez envie D a E o un S' a A? P(SnA ) = 0.25 > 0.083. 

c. Estandar o cualquier empaque a Norteamerica: 

P(S U N) = P{S) + P(N) - P(S C\ N) — 0.584 + 0.334 - 0.167 = 0.751 

d. P(N U/))= P(N) + P{D) - P(N Pi D) = 0.334 + 0.417 - 0.167 = 0.584. 

2. Uso del teorema de Bayes Solo el 60% de los estudiantes de la clase de estadistica del Profesor Harmond 
pasaron la primera prueba. De quienes pasaron, el 80% estudiaron, el 20% de quienes no pasaron si estudiaron. 
^Deberia usted estudiar para las pruebas de ese profesor? 

Esto puede determinarse calculando la probabilidad de que usted pase, dado que usted estudio. De la 
informacion anterior: P(P) = 0.60, P(S |P) = 0.80, y P(S I P) = 0.20. 

Entonces 
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P(P \C) = P(PKS) = HP) X />(5 1/>) 

1 ] P(S ) />(/>) X P(5 | P) 4- />(/>) X P(s I P) 

= ( 060 X 080 ) 

(0.60X0.80) + (0.40X0.20) 

= 0.48 

(0.48) + (0.08) 

= 0.857 > P(P) = 0.60 

3. iComo puede ocurrir un evento? La probabilidad de que John solucione un problema de estadfstica en 
particular es del 40%. Hay un 70% de probabilidad de que Fred lo solucione. ^Cual es la probabilidad de que 
sea resuelto? Asuma que John y Fred trabajan separadamente y los resultados son por tanto independientes. 

Puede resolverse si John lo soluciona (y Fred no lo hace), si Fred lo soluciona (y John no lo hace), o si ambos 
lo solucionan. 

P(S) = P(J DF) + P(J n F) + P{J Pi F) 

= (0.40X0.30) + P(0.60)(0.70) + (0.40)(0.70) 

- 0.82 

4. Simplification utilizando combinaciones Harry vende al 30% de los clientes a quienes llama. Si el hace tres 
llamadas hoy ^cual es la probabilidad de que haga exactamente una venta? 

Harry puede vender a cualquiera de los 3 clientes: 

P{ 1) = 50505 = (0.30X0.70X0.70) = 0.147 
+ 5 O 5 O 5 = (0.70)(0.30)(0.70) = 0.147 
+ 5050 5 = (0.70X0.70X0.30) = 0.147 
= 0.441 

Como altemativa, determine la probabilidad de que se haga una venta a cualquiera de los 3, y luego multiplique 
por el numero de formas en las cuales puede hacerse una venta. 

P{ 1) = [(5 O 5 O 5)] X 3 C, 

= 0.147 X 3 
= 0.441 


Lista de formulas 


[4.1] 


P(E) = 


Numero de veces en que el evento ha ocurrido en el pasado 
Numero total de observaciones 


Frecuencia 

relativa 


[4.2] 


P(E) = 


Numero de formas en las que puede ocurrir un evento 
Numero total de posibles resultados 


Modelo 

clasico 
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[4.3] 

«*w-**m 

Probabilidad condicional 

[4.4] 

P(A nfi) = P(A) X P(B) 

Probabilidad de eventos 
independientes 

[4.5] 

P(A fl B) = P(A) X P(B I A) 

Probabilidad de eventos 
dependientes 

[4.6] 

P(A US) = P(A) + P(B) - P(A n B) 

Probabilidad de eventos que 
son mutuamente excluyentes 

[4.7] 

P(A U B) = P(A) + P(B) 

Probabilidad de eventos 
mutuamente excluyentes 

[4.8] 

P(A 1 D) ~ HAnD) 

1 P(A n d) + P(B n D) 

Teorema de Bayes 


P(A) X P(D\A) 

P(A) X P(D | A) + P(B) X P(D | B) 


[4.9] 

P = ” ! 

" r (« - /-)! 

Permutaciones 

[4.10] 

C = 

" r rl ( n - r)l 

Combinaciones 


Ejercicios del capi'tulo 

30. Dell Publishing tiene 75 titulos distintos de libros, clasificados por tipo y costo de la siguiente manera: 


Tipo 


Costo 


US$10 

US$15 

US$20 

Ficcion 

10 

8 

3 

Biografias 

12 

10 

9 

Historico 

4 

17 

2 


Halle la probabilidad de que un libro seleccionado aleatoriamente sea: 

a. Ficcion o cueste US$10. 

b. Historico y cueste US$20. 

c. Historico y cueste o US$10 o US$15. 

d. Ficcidn y cueste menos de US$20. 

e. Biogrdficoo cueste US$15. 

/ Biograficoo cueste mas de US$10. 
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31. El departamento administrativo de State University tiene acceso a tres maquinas de fax. La probabilidad de 
que cada una este fuera de servicio es 20/100, 25/100, y 30/100, respectivamente. Asumiendo independencia 
entre ellas, encuentre la probabilidad de que: 

a . La primera y la segunda esten fuera de servicio. 

b. La primera y la tercera esten fuera de servicio. 

c. Todas esten fuera de servicio. 

d. Ninguna este fuera de servicio. 

e . Una este fuera de servicio 
/ Dos esten fuera de servicio. 

g. Dos o mas esten fuera de servicio. 

32. Mark compra tres acciones diferentes. La probabilidad de que la primera aumente su valor es 1/3, la probabilidad 
de que la segunda aumente es de 3 /4 y la probabilidad de que la tercera aumente su valor es de 1/10. 
Determine la probabilidad de que: 

a . Todas aumenten de valor. 

b. Ninguna aumente su valor. 

c. Una aumente su valor 
d> Dos aumenten su valor. 

e . Por lo menos dos aumenten su valor. 
f Por lo menos una aumente su valor. 

33. Una empresa de construction local descubrio que solo el 20% de todos los trabajos se terminaban a tiempo, 
mientras que el 30% sufrfan sobrecostos. Ademas, los sobrecostos se presentaban el 75% de las veces en las 
que se terminaba el trabajo a tiempo. El propietario de la empresa desea conocer la probabilidad de que un 
trabajo tenga sobrecostos: 

a. Y se realice a tiempo. 

b. O se realice a tiempo. 

34. Del problema anterior, ^corno puede probar que los sobre costos y la probabilidad de que un trabajo se haga 
a tiempo no son eventos mutuamente excluyentes? 

35. La revista Fortune descubrio que el 10% de los trabaj adores en cargos ejecutivos de alto nivel eran mujeres, 
y que el 3% de quienes estaban en un alto nivel eran mujeres con MBA (Master en Administration de 
Negocios). La junta directiva de una empresa grande, cuyo perfil ejecutivo se ajusta a esta description, desea 
seleccionar una de las mujeres ejecutivas aleatoriamente. ^Que probabilidad hay de que seleccionen a una 
mujer con MBA? 

36. Diez unidades de produccion se seleccionan de una linea de produccion. Tres de estas 10 son defectuosas. 
Si se deben sacar 5 de las 10, ^cual es la probabilidad de que 2 sean defectuosas? 

37. Biggie Burger ofrece sus hamburguesas con una selection de 5 condimentos diferentes: mostaza, pepinillos, 
salsa de tomate, cebolla y tomate. ^Cuantas hamburguesas diferentes puede comprar? 

38. En Illinois las placas de los autos constan de 3 letras seguidas de 3 numeros. ^Cuantas placas distintas 
pueden hacerse? 

39. Randy Rusty, propietario de Rusty Cars, Inc., ofrece a sus clientes automoviles con 8 opciones de color, 4 
paquetes de interior, y 3 disenos diferentes de techo corredizo. ^Entre cuantos automoviles pueden escoger 
los clientes de Randy? 
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40 . Estudios hechos por la Asociacion Nacional de Education demuestran que el 30% de los profesores de la 
nation dejan la profesion despues de 10 anos. Ademas, entre quienes la abandonan, el 60% tienen un titulo 
avanzado, mientras que entre los que no dejan la profesion el 20% tienen un titulo avanzado. El Sr. Chips, el 
profesor favorito de los estudiantes, acaba de obtener un titulo avanzado. ^Cual es la probabilidad de que 
deje a los estudiantes y consiga un trabajo distinto? 

41 . Una empresa manufacturera tiene plantas en Chicago y Houston. La planta de Chicago produce el 40% de la 
production total, con un 10% en la tasa de defectos. La planta de Houston tiene una tasa de defectos del 20%. 
Si solo se encuentra que una unidad es defectuosa, ^,es mas probable que provenga de Chicago o de 
Houston? 

42 . El presidente debe seleccionar 5 miembros de una lista de 12 senadores, de los cuales 7 lo apoyan y 5 le hacen 
oposicion. Si el selecciona al azar, ^cual es la probabilidad de que la mayorfa del comite apoye al presidente? 

43 . Kelly Katz vende telefonos moviles ofreciendo 5 estilos, 4 colores y 7 opciones de servicio. ^Cuantos 
telefonos diferentes puede ofrecer el Sr. Katz a sus clientes? 



En el caso presentado en la section Planteamiento del 
Escenario al inicio de este capitulo, el Sr. Michael Berry, 
presidente de la Asociacion Nacional de Areas de Esquf 
para analizar las condiciones financieras de 850 centros de 
esqui en la nation, Berry le proporciona la siguiente 
information que el ha recolectado: ninguno de los centros 
urbanos esta en bancarrota, 635 de los centros de esqui son 
urbanos, 17 de los centros de esqui que estan aislados estan 
en bancarrota, 765 de los centros no estan en bancarrota y 
60 de todos los centros estan ubicados en zonas aisladas. 

Utilizando estos datos limitados, proporcione una 


EN ESCENA 


respuesta a Berry que contenga todos los hechos relevantes 
que usted pueda aportar a sus esfuerzos por mejorar las 
condiciones financieras de los centros de esqui. El reporte 
debe contener una tabla de contingencia y una tabla de 
probabilidad. ^Que conclusiones puede sacar y que 
resultados espetificos considera usted que senan de mayor 
utilidad para Berry? Berry esta interesado especialmente 
en cual localidad es la que tiene mayor probabilidad de 
quedar en bancarrota. 

Formalice sus resultados en forma de un reporte de 
negocios tal y como se describe en el apendice 1. 


Del escenario a la vida real 

En el analisis de la section Puesta en Escena sobre los centros de esqui, se vio que la ubicacion en un area urbana 
importante era un factor determinante en su exito financiero. £ Puede pensar en los motivos de esto? ^Puede 
pensar en factores adicionales que contribuirfan al exito financiero de los centros de esqui? 

La Asociacion Mundial de Esqui (www.worldski.com) es una organization deportiva que organiza paquetes 
de viajes para esquiadores a centros de esqui de todo el mundo. En este sitio, visite “Directorio de Beneficios” y 
revise algunos de los paquetes disponibles para los miembros. ^Cual es el elemento comun en todos estos 
convenios? ^Cree usted que los convenios de descuentos serfan un factor importante en el exito de un centro de 
esqui? 

La Asociacion Nacional de Areas de Esqui mantiene la Guia Oficial de Centros de Esqui ( The Official Ski 
Resort Guide) ( www.skifund.com ). En las descriptions de los centros que se encuentran en este sitio, ^que 
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caracterfsticas le atraen hacia centros distintos? La Asociacion Colegiada de Esqiri de Estados Unidos ( The U.S. 
Collegiate Ski Association ) ( www.beater.com/uscsa ) enumera las competencias de esqui programadas por equipos, 
fecha y lugar. ^Las competencias de esqui podrfan influir en su seleccion de un centro de esqui? 









Plan del capi'tulo 


Este capftulo analiza c6mo pueden utilizarse las distribuciones de probabilidad para solucionar muchos problemas 
de negocios. En las ilustraciones se utilizan variables tanto discretas como continuas. 


Distribuciones de probabilidad 
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E S C E N A R I 0 


Un estudio de factibilidad realizado por profesores de la 
Escuela de Negocios de la Universidad de Bradley {College 
of Business at Bradley University ) en Peoria, Illinois, revelo 
que los viemes y sabados en la noche el tiempo de respuesta 
a las llamadas al numero 911 oscilaba entre 1.2 y 4.6 minutos 
y se comprobd que estaban distribuidas uniformemente. 
Las llamadas tenfan la distribution de Poisson y alcanzaron 
una tasa promedio de 9 por hora. Si la policia de la ciudad 
tu viera que responder mas de 3 llamadas, en cualquier 
momento podnan acudir a la policia estatal para solicitarles 
ayuda. 

El alcalde de la ciudad deseaba reducir el tiempo promedio 
de respuesta a 2 minutos. Se estimaba que el costo de mas 
patrullas, m&quinas de bomberos y personal serfa de 
US$575,000 por cada reduccidn de 30 segundos. El costo 


fix) 


Distribucidn uniforme 


debfa ser asumido por un impuesto predial a las casas 
cuyo valor en el avaluo catastral estuviera por encima de 
US$70,000. Las casas en Peoria tienen un avaluo catastral 
promedio de US$45,750 con una desviacion estandar de 
US$15,1 10 y parecia estar distribuido normalmente. En el 
momento del estudio hab£a 42,089 casas en los limites de 
la ciudad. 

El estudio presentado a la alcaldia estaba disenado para 
evaluar la respuesta de la ciudad a las emergencias, asi 
como tambien la factibilidad de lograr la meta de reduction 
en el tiempo de respuesta que queria el alcalde. El reporte 
final necesito de la aplicacidn de numerosas distribuciones 
de probabilidad asf como de una evaluation del potencial 
de promulgar un sobrecargo al impuesto predial para 
financiar las mejoras del programa. 

Distribucidn de Poisson 


1.2 


4-6 Minutos 


Tiempos de respuesta 



Distribucidn normal 



5.1 Introduction 

En el capitulo anterior se analizo el concepto de probabilidad. El objetivo era determinar la probabilidad de un 
evento. En este capitulo defmiremos las variables aleatorias y utilizaremos las leyes de probabilidad. Una variable 
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aleatoria es una variable cuyo valor es el resultado de un evento aleatorio. Se supone que se lanza una moneda 
tres veces y se anota el numero de caras que se obtienen. Los posibles resultados son 0 caras, 1 cara, 2 earns, o 
3 caras. La variable aleatoria es el numero de caras que se obtienen, y los posibles resultados son los valores de 
la variable aleatoria. Como segundo ejemplo, los pesos de envio del agua mineral en contenedores oscilaban 
aleatoriamente entre 10 a 25 libras. Los pesos reales de los contenedores, en libras, son los valores de la variable 
aleatoria “peso”. 

Tal y como lo sugieren estos dos ejemplos, las variables aleatorias pueden ser discretas o continuas. Una 
variable aleatoria discreta puede asumir solo ciertos valores, con frecuencia numeros enteros, y resulta 
principalmente del conteo. El numero de caras en el experiment del lanzamiento de la moneda es un ejemplo de 
una variable aleatoria discreta. Los valores de la variable aleatoria se restringen solo a ciertos numeros: 0, 1, 2, y 
3. El resultado del lanzamiento de un dado, el numero de camiones que llegan por hora al puerto de carga, y el 
numero de clientes que estan en fila para sacar sus libros favoritos, son otros ejemplos de variables aleatorias 
discretas. 

Una variable aleatoria continua resulta principalmente de la medicion y puede tomar cualquier valor, al menos 
dentro de un rango dado. Los pesos del agua mineral es un ejemplo, debido a que los contenedores pueden tomar 
cualquier valor entre 10 y 25 libras. Otros ejemplos de variables aleatorias continuas incluyen la estatura de los 
clientes en una tienda de ropa, los ingresos de los empleados en un centro comercial local y el tiempo transcurrido 
entre la llegada de cada cliente a la biblioteca. En cada caso, la variable aleatoria puede medirse con cualquier 
valor, incluyendo fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un numero 
continuo o infinito de subdivisiones (el dolar puede subdividirse solo 100 veces), comunmente se tratan como 
distribuciones continuas de probabilidad. 

Una distribucion de probabilidad es un despliegue de todos los posibles resultados de un experiment junto 
con las probabilidades de cada resultado. Del trabajo realizado en el capftulo 4, se puede determinar que la 
probabilidad de lanzar una moneda tres veces y de obtener (1) ninguna cara es 1/8, (2) 1 cara es 3/8, (3) 2 caras es 
3/8 y (4) 3 caras es 1/8. Esta distribucion de probabilidad se presenta en la tabla 5.1 la cual muestra todos los 
resultados posibles y sus probabilidades. Vale la pena destacar que las probabilidades suman 1. La misma 
information tambien puede mostrarse graficamente como en la figura 5. 1 


Tabla 5.1 

Distribucion 

discreta 

de probabilidad 
para el numero 
de caras 


Resultado (caras) 

Probabilidad 

0 

1/8 

1 

3/8 

2 

3/8 

3 

1/8 


1 


Figura 5.1 

4/8 

Distribucion 
de probabilidad 

3/8 

para el numero 
de caras 

2/8 


1/8 



o 


i 


2 
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Distribution de probabilidad Es una iista de todos los resultados posibles de algun 
experimento y de la probabilidad relacionada con cada resultado. 


La probabilidad de que la variable aleatoria X tome algun valor especffico, x., se escribe P(X =x.). Por tanto, la 
probabilidad de que los tres lanzamientos de una moneda resulten en dos caras es P(X = 2) = 3/8. Vale la pena 
notar que 0 < P(X = x.) < 1 y X P(X = x.)= 1. 


5.2 Media y la varianza de las distribuciones discretas 

Asi como en el capitulo 3 se calculo la media de un conjunto de datos, tambien se puede determinar la media de 
una distribucion de probabilidad. La media aritmetica de una distribucion de probabilidad se llama el valor esperado 
E(X), y se halla multiplicando cada resultado posible por su probabilidad y sumando los resultados, tal y como se 
muestra en la formula (5.1). 


Media o valor esperado 
de una distribucion 

p. = E(X) = 2[0c, )/>(*;)] 

[5.1] 

de probabilidad disereta 




en donde x. son los resultados individuales. 

/ 


La distribucion de probabilidad para el experimento de lanzar un dado se muestra en las primeras dos columnas 
de la tabla 5.2. La columna (3) ilustra el calculo del valor esperado para el experimento utilizando la formula (5.1). 
Cada resultado se multiplica por su respectiva probabilidad, y los resultados se suman, produciendo p = E(X) = 
3.5. Esto sugiere que si se lanza un dado £se puede esperar obtener 3.5? Dificilmente. Significa que si se promedian 
los resultados de los lanzamientos del dado (teoricamente, un numero infinito), se obtendra 3.5. 


Tabla 5.2 

(D 

(2) 

(3) 

(4) 

Distribucion disereta 

Solucion {*.} 

P{x) 

ix)P{x) 

{x.-pY-P{x) 

de probabilidad 

1 

1/6 

1/6 

(1-3.5) 2 -1/6 = 1.042 

para el lanzamiento 

2 

1/6 

2/6 

(2-3.5M/6 = 0.375 

de un dado 

3 

1/6 

3/6 

(3-3.5M/6 = 0.042 


4 

1/6 

4/6 

(4-3.5) 2 -l/6 = 0.042 

5 

1/6 

5/6 

(5-3.5)M/6 = 0.375 

6 

1/6 

6/6 

(6-3.5) 2 -1/6 = 1.042 


1.00 

Ts = p= E(X) 

2.92 = 


Valor esperado El valor esperado de una variable aleatoria disereta es la media 
ponderada de todos los posibles resultados en los cuales los pesos son las probabilidades 
respectivas de tales resultados. 
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La varianza de una distribucion de probabilidad es conceptualmente la misma que la varianza que se calculo en 
el capi'tulo 3. Es el promedio de las desviaciones al cuadrado con respecto de la media. La varianza puede 
escribirse como: 


Varianza de una distribucion 
de probabilidad 


a 2 = 2[(x,. - fx) 2 PC*-,)] 


[5.2] 


La formula (5.2) mide la diferencia entre cada uno de los resultados y su media. Tales diferencias se elevan al 
cuadrado y se multiplican por sus respectivas probabilidades. Luego se suman los resultados. La columna (4) de 
la tabla 5.2 revela, a 2 = 2.92. 

La des viacion estandar es <7 = = ^232 = 1 .7 1 . La varianza y la des viacion estandar tienen la misma 

interpretacion que se les dio en el capftulo 3. Miden la dispersion de los resultados alrededor de su media. La 
varianza se expresa en unidades al cuadrado, pero la desviacion estandar se expresa en las mismas unidades que 
la variable aleatoria y por ende con frecuencia tiene una interpretacion mas racional. 


Ejemplo 5.1 


El numero de casas que Ponder Real Estate vendio mensualmente vario de 5 a 20 junto con la 
frecuencia de cada nivel de ventas que aparece en las dos primeras columnas de la tabla que se 
muestra a continuation. 


(1) 

Numero de meses 

(2) 

Casas (x) 

(3) 

P{x) 

(4) 

(*) P{x) 

(5) 

(x -yU) 2 P{x) 

3 

5 

3/24 = 0.125 

0.625 

(5— 1 0.9 1 2) 2 (0.125) = 4.369 

7 

8 

7/24 = 0.292 

2.336 

(8-10.912) 2 (0.292) = 2.476 

4 

10 

4/24 = 0.167 

1.670 

(10-10.912) 2 (0.167) = 0.139 

5 

12 

5/24 = 0.208 

2.496 

( 1 2— 1 0.9 1 2) 2 (0.208) = 0.246 

3 

17 

3/24 = 0.125 

2.125 

(17-1 0.91 2) 2 (0.125) = 4.633 

2 

20 

2/24 = 0.083 

1.660 

(20— 1 0.9 1 2) 2 (0.083) = 6.855 

24 


1.000 

10.912 = 

H 18.718 = cr 2 


El Sr. Ponder espera que estas cifras reflejen un incremento en el numero promedio de ventas, por 
encima del 7.3 que vendio en meses anteriores, y una reduction en la variabilidad de las ventas 
mensuales que habian sido de <7= 5.7. De lo contrario, el ha decidido vender el negocio y convertirse 
en un bufon de rodeo. iQ ue consejo puede ofrecerle al Sr. Ponder? 

Solution 

Se debe determinar la probabilidad de cada nivel de ventas tal y como se muestra en la columna (3). 
Por ejemplo, en 3 de los 24 meses, se vendieron 5 casas: P(x. = 5) = 0. 1 25. El valor esperado o media 
se calcula multiplicando las probabilidades por sus respectivos niveles de venta. Esto se muestra 
en la columna (4) como jj, = 10.9 12 casas por mes. La variabilidad se mide por la varianza y se muestra 
en la ultima columna. La diferencia al cuadrado entre cada observation y la media de 10.912 se 
multiplica por las probabilidades apropiadas y se suman resultando d 2 = 18.718 casas al cuadrado, 
con <7= 4.236 casas. 

Interpretacion 

El Sr. Ponder puede tranquilizarse. Ha incrementado su promedio mensual de ventas y ha reducido 
su variabilidad. Deberfa quedarse en el negocio de finca raiz. 
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Ejercicios de la seccion 


1. De varios ejemplos tanto de distribuciones discretas de probabilidad como de distribuciones continuas de 
probabilidad que pueden aparecer comunmente en un negocio. ^Cual es la diferencia entre una distribution 
discreta de probabilidad y una continua? 

2. Las siguientes variables aleatorias ^son discretas o continuas? En cada caso explique el porque de su 
respuesta. 

a . Los carros vendidos por Harry el honesto. 

b . Los ingresos que gana Harry. 

c. Los tiempos de termination de un trabajo en particular. 

d. Los empleados requeridos para completar dicho trabajo. 

3. Calcule e interprete el valor esperado, la varianza, y la desviacion estandar del experimento de lanzar una 
moneda tres veces y observe el numero de caras. 

4 . El numero de quejas de los empleados en Fidelity Services oscila entre 0 a 6 cada dia como se muestra en la 
siguiente tabla. Calcule e interprete el valor esperado, la varianza y la desviacion estandar. 


Quejas 

Numero de dias 

Quejas 

Numero de dias 

0 

3 

4 

2 

1 

4 

5 

1 

2 

3 

6 

4 

3 

6 




5 . Para recolectar los datos de un proyecto de investigation, un estudiante de mercadeo en una universidad 
pequena en el centro de Estados Unidos conto en 50 cursos de negocios el numero de estudiantes que 
habian comprado recientemente discos compactos. En 12 clases no encontro estudiantes que hubieran 
hecho dicha compra, 3 estudiantes habian comprado en 8 clases, 4 habian comprado en 9 clases, 5 en 15 
clases y 7 estudiantes, de las seis clases restantes habian aumentado sus colecciones de musica. El estudiante 
deseaba comenzar su investigation resumiendo sus datos. ^Como podrfa usted ayudarle? 


Un gran numero de decisiones empresariales depende de la distribution de probabilidad prevaleciente. Una 
de las mas importantes es la distribution binomial. 


5.3 La distribucion binomial - una distribucion discreta 
de probabilidad 

El experimento de lanzar la moneda discutido anteriormente tiene solo dos posibles resultados: (1) cara y (2) sello. 
La probabilidad de cada uno es conocida y constante de un intento (lanzamiento) al siguiente, y ademas el 
experimento puede repetirse muchas veces. Los experimentos de este tipo siguen una distribucion binomial. Con 
base en el proceso de Bernoulli, llamado asi por Jacob Bernoulli (1654 -1705), miembro de una familia de matematicos 
suizos, una distribution normal presenta cuatro propiedades: 

• Solo debe haber dos posibles resultados. Uno se identifica como exito, y el otro como fracaso. Sin embargo, 
se advierte que estos terminos no tienen ninguna connotation de “bueno” o “malo”. Son completamente 
objetivos, y un “exito” no implica necesariamente un resultado deseable. 
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• La probabilidad de un exito, n, sigue siendo constante de un ensayo al siguiente, al igual que lo hace la 
probabilidad de fracaso, 1 - n. 

• La probabilidad de un 6xito en un ensayo es totalmente independiente de cualquier otro ensayo. 

• El experimento puede repetirse muchas veces. 

Debe haber quedado claro por que el lanzamiento de la moneda cumple con los requisitos de una distribucion 
binomial. 

Podrfan citarse muchos ejemplos relacionados con los negocios. Los sindicatos laborales con frecuencia 
desean saber cuantos trabajadores: (1) estan interesados en unirse al sindicato; (2) quienes no estan interesados. 
Los banqueros pueden hacer encuestas a los expertos en economfa sobre si las tasas de interes: (1) aumentaran 
o (2) no aumentaran. El personal de mercadeo desea saber si una persona: (1) prefiere o (2) no prefiere cierto 
producto. La aplicacion de la distribucion binomial al campo de los negocios es casi ilimitada. 


Una distribucion binomial Cada ensayo en una distribucion binomial termina en 
solo uno de dos resultados mutuamente excluyentes, uno de los cuales se identifica 
como un exito y el otro como un fracaso. La probabilidad de cada resultado permanece 
constante de un ensayo al siguiente. 


Si se conoce la probabilidad de que un ensayo determinado producira un exito, es posible estimar cuantos 
exitos habra en un numero dado de ensayos. Por ejemplo, si se conoce la probabilidad de que un solo trabajador 
este interesado en unirse al sindicato, entonces puede estimarse la probabilidad de que un numero determinado 
de trabajadores de la fuerza laboral estarfa interesado en unirse. La probabilidad de que de n numero de trabajadores, 
un numero x dado, este interesado en unirse al sindicato es 


La formula 
binomial 


Aunque a simple vista la formula parece intimidante, no se desespere. Las probabilidades para diferentes 
valores de n, x y n va se han calculado y se han tabulado en el apendice III, tabla B, al final del libro. 

Consideremos la siguiente situacion: un gerente de credito de American Express ha descubierto que n= 10% 
de los usuarios de tarjeta no paga el monto completo de la deuda durante un mes dado. Desea determinar la 
probabilidad que de n = 20 cuentas seleccionadas de manera aleatoria, x = 5 de las cuentas no scan pagadas. Esto 
puede expresarse como P(X = 5 | n = 20, n= 0. 10), lo cual se lee como “la probabilidad de cinco exitos dado que hay 
20 ensayos y la probabilidad de un exito de cualquier ensayo es del 10%”. 

La probabilidad de que 5 cuentas de las 20 muestreadas sigan sin ser canceladas se puede calcular utilizando 
la formula (5.3). En donde n = 20, X = 5, y n= 0. 10, entonces se tiene 


n: 


7r'( 1 - t r)"~- v 


x!(n - x)! 

= „C v (77-V(l ~ TT) n 


[5.3] 


20 c 5 (0. 10) 5 (0.90) 20 - 5 = (15504)(0.00001)(0.20589 1 1) =0.0319 

Si la probabilidad de que no se pague una cuenta cualquiera en su totalidad es n = 0.10, entonces existe un 3.19% 
de oportunidad de que exactamente 5 de 20 cuentas seleccionadas de manera aleatoria tengan un saldo a favor. 

Esta information se obtiene mas facilmente utilizando la tabla B. Vale la pena destacar que las dos primeras 
columnas en la tabla muestran los posibles valores para nyx. Ubique el valor de 20 para n debido a que hay 20 
ensayos (cuentas) en el experimento. Debido a que el gerente de credito busca la probabilidad de que x = 5 exitos 
(cuentas no pagadas), localice la fila que contenga los valores de probabilidad para x=5. Proceda a lo largo de la 
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fila hasta encontrar la columna encabezada con n = 0.10. Alii se encontrara el valor 0.0319, la respuesta a la 
pregunta del gerente de credito. 

Consideremos otro ejemplo de distribucion binomial. Se tiene que el personal de ventas de Widgets, Inc., hace 
una venta al 15% de los clientes a los que visitan. Si un miembro del personal de ventas llama a 15 clientes hoy 
^cual es la probabilidad de que venda exactamente dos aparatos? Dado K= 0. 15, n - 15 y x = 2, ubique el valor para 
n- 15, luego la fila que pertenezca a X = 2. En la fila encabezada por la columna n= 0. 15, encontrara P(x= 2 I n = 1 5, 
7t = 0.15) = 0.2856. Existe un 28.56% de oportunidad de que se hagan exactamente dos ventas de las 15 llamadas. 


Ejemplo 5.2 

De acuerdo con el Periodico de Educacion Superior (Journal of Higher Education ), el 40% de 
todos los bachilleres trabajan durante el verano para ganar dinero para la educacion universitaria 
correspondiente al siguiente perfodo de otono. Si 7 bachilleres se seleccionan de manera aleatoria, 
^cual es la probabilidad de que (a) 5 tengan trabajos en el verano, ( b ) ninguno trabaje, ( c ) todos 
trabajen? 


Solution 

a . Ubique el valor de n = 7 y K= 0.40. La fila correspondiente a x = 5 da un valor de 0.0774. Existe 
un 7.74% de probabilidad de que 5 de 7 bachilleres hayan tornado trabajos de verano para 
ganar el dinero para su educacion. 

b . Dado n = 7 y n = 0.40, la probabilidad de que ninguno trabaje se muestra en la tabla como 
P(* = 0) = 0.0280. 

c. La probabilidad de que todos los estudiantes trabajen parece ser P(x = 7 I, n = 0.4) = 0.0016. 

Interpretation 

Es poco probable que ninguno de los estudiantes trabaje. 


La tabla binomial incluye los valores de n solo hasta 0.5. ^Que debe hacerse si la probabilidad de un exito es 
mayor? Supongamos que el 70% de todos los residentes de Flatbush tiene sus computadores enlazados con 
internet. ^Cual es la probabilidad de que de los 10 residentes seleccionados aleatoriamente, 6 esten “conectados”? 
ya que n > 0.5, no se puede utilizar la tabla B (Apendice III) sin algun ajuste. Sin embargo, si la probabilidad de un 
exito (un residente este conectado a Internet) es P(S) = 0.70, la probabilidad de que no este enlazado es P(S ) = 
0.30. Ademas, si 6 de los 10 residentes son usuarios de internet, entonces 4 no lo son. Es decir, 6 exitos a n= 0.70 
es lo mismo que 4 fracasos a n = 0.30. En lugar de hallar x exitos en 7T, se halla n-x fracasos a 1 .00 - n. 

Esta practica puede ilustrarse construyendo dos arreglos ordenados como los que se ven aqui, uno de 0 a 10 
a 7t= 0.70 y uno de 10 a n= 0.30. 


01 23456789 10 [k = 0.70) 

10 9876543210 (k = 0.30) 

Esto revela mas claramente que P(X =6 I n = 10, n = 0.70) = P(X = 4 I n= 10, n = 0.30). De la tabla B (Apendice III) 
esto se ve como 0.2001 . 


A. La media y la varianza de una distribucion binomial 

Antes se mostro como determinar la media y la varianza de una distribucion discreta utilizando las formulas (5.1) 
y (5.2). Sin embargo, si solo hay dos resultados posibles, como en la distribucion binomial, la media y la varianza 
pueden determinarse mas facilmente: 
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Media de una distribucion 
binomial 

E(X) = n = nn 

[5.4] 

y 

Varianza de una distribucion 
binomial 

a 2 = nn{ 1 -k) 

[5.5] 


Para los residentes de Flatbush, si n — 10, E(X) = (10)(0.70) = 7. De las 10 personas seleccionadas aleatoriamente, 
se esperarfa que 7 estuvieran inscritas en internet. La varianza es ct 2 = (10)(0.70)(0.30) = 2.1 y la desviacion 
estandar es a= 1.45. 


B. Distribuciones binomiales acumuladas 

Dados los datos del ejemplo 5.2 para los trabajos de verano de los estudiantes, se supone que se desea determinar 
la probabilidad de que 3 o menos estudiantes trabajaron. Este problema implica una distribucion binomial acumulada 
debido a que se esta interesado en un rango de valores (0 a 3) en lugar de un solo numero especffico. El siguiente 
arreglo ordenado ilustra este punto. La probabilidad del evento A (0 a 3 trabajan) es P(A) = P(X) < 3). 

Even to A 

0 1 2 3 1 4 5 6 7 (it = 0.40) 

En la tabla B (apendice III), esto puede hallarse sumando P(X =0) + P(X = 1 ) + P(X =3) + P(X = 3) = 0.7 1 02. Por 
motivos de conveniencia, estas sumas se compilan en la tabla C, la cual muestra la probabilidad del numero de 
6xitos que es igual a o menor que cierta cantidad. En nuestro caso actual, se tiene que P(X <3 In = 7 k=() 40) = 
0.7102. 

Vale la pena recordar que la tabla C proporciona la probabilidad de que el numero de exitos sea igual a o menor que 
cierta cantidad. Se supone que se desea conocer P(A) = P(X > 5 ). La tabla C no dara directamente la probabilidad de 
que un numero de exitos sea igual a o mayor que alguna cantidad. Observando el arreglo ordenado se tiene que 

Evento A 

f i 

0 1 2 3 4 5 6 7 (j r = 0.40) 

Evento A 

Si el evento A es PCX > 5), entonces A es 4 o menos, lo cual puede hallarse en la tabla C. Se sabe que P(A) = 1 - 
P(A). Entonces, P(X> 5 I n = 7, n = 0.40) = \-P(X<4 \n = l,n= 0.40). De la tabla C, se observa que este es 1 - 
0.9037 = 0.0963. La probabilidad de que por lo menos 5 de 7 estudiantes tengan trabajo en verano es del 9.63%. 

Se supone que se necesitaba determinar la probabilidad de que entre 3 y 5 estudiantes inclusive, trabajaron. 
De nuevo el arreglo prueba que es de utilidad. 

Evento A 

f 1 

o 1 2 3 4 5 6 7 (tt — 0.40) 

P(Xs 2) = 0.4199 

P{Xs 5) = 0.9812 

P{ 3s7<5) = P(Xs5) - P(Ji<2) = 0.9812 - 0.4199 = 0.5613 
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P( 3 < X < 5 \n-l,7t- 0.40) debe determinarse en dos pasos. Primero se determina la probabilidad de que el numero 
de estudiantes con trabajos sea de 0 a 5 (lo que incluye el intervalo de 3 a 5 que es el que sebusca), y luego se resta 
la probabilidad de que el numero de estudiantes emprendedores sea 2 o menos. Luego P(3 < X < 5) = P(0 < X < 5) 
-P(0<X< 2) = 0.9812 -0.4199 = 0.5613. 

Si 7i > 0.50, se necesitan dos arreglos ordenados. Se asume que el 80% de los graduados tomaron trabajos de 
verano. Debe construirse un arreglo para k = 0.80 y uno para n = 0.20. 

Even to A 

) 

0 1 2 3 4 5 6 7 (tt = 0.80) 

7654321 0 (tt = 0.20) 

Evento A Evento A 

Si, al igual que antes, se desea la probabilidad de que 3 o menos estudiantes trabajen, se debe hallar P(A) = P(X 
<3 \ n = l,7t= 0.80). Debido a que la tabla C no contiene valores para n> 0.50, se debe regresar al arreglo ordenado 
para n = 1 - 0.80 = 0.20. Se observa que la probabilidad 3 o menos trabajen con n = 0.80 es la misma que la 
probabilidad de que 4 o mas no trabajen. Es decir, si 3 de 7 trabajan, 4 no; si 2 de 7 trabajan, 5 no, y asi sucesivamente. 
Asf, P(A) tambien es igual a P(X >4 | n = 7, n= 0.20). Sin embargo, todavfa se tiene un problema. La tabla C no dara 
directamente la probabilidad de que X sea igual a o mayor que algun valor, como 4 en este caso. La solution a este 
dilema persistente es la misma que la anterior: se halla la probabilidad de A, es decir, 3 o menos, y se resta de 1 . P(X 
< 3 I n = 7, tt= 0.80) = 1 - P(X < 3 I n = 7, n= 0.20) = 1 - 0.9667. = 0.0333. 


C. Usando el computador 

Tanto Minitab como Excel calculan facilmente las probabilidades binomiales. Al utilizar Minitab para determinar 
las probabilidades de los trabajos de verano del ejemplo 5.2, ingrese los valores para X en las celdas de la columna 
( 1 ) (o en cualquier otra columna) . En este caso, ingrese 5 , 0, y 7 en las primeras tres celdas de la columna ( 1 ) . Luego 
escoja Calc > Probability Distributions > Binomial > Probability. Ingrese el numero de ensayos, 7 en este caso, 
en la casilla de Number of Trials, 0.40 en la casilla de Probability of a Success, y Cl (en donde se ingreso 
anteriormente los valores para X) en la casilla de Input Column. La impresion resultante se ve en la pantalla 5. 1 . Si 
se ha seleccionado Cumulative Probability en lugar de Probability antes mencionada, Minitab habra devuelto las 
probabilidades acumuladas tal y como aparecen en la tabla C. 


Pantalla de Minitab 5.1 

Probability density function (Funcion de densidad de probabilidad) 

Binomial 

con n = 7 y p = 0.400000 

X 

P (X=x) 

5.00 

0.0774 

0.00 

0.0280 

7.00 

0.0016 

MTB > 



Excel funciona de forma similar. Se coloca el cursor en la celda de la hoja de trabajo en donde se desea que 
aparezca la respuesta. Luego se selecciona Insertar > Funcion > Estadisticas (de la casilla de categona de 
funciones) > Distr.Binom (de la casilla nombre de funcion ). Se hace clic en Aceptar. Se ingresa 5 en la casilla 
de Num-exito (para 5 exitos), 7 en la casilla de Ensayos, 0.4 en la casilla de Prob-exito, y Falso en la casilla de 
Acumulado. Seleccione Aceptar. La respuesta aparecera en la casilla de Valor en la esquina superior derecha y 
en la celda que se haya designado en la hoja de trabajo. Si se ha ingresado Verdadero en la casilla de Acumulado, 
la probabilidad acumulada para 5 exitos se reportara tal y como aparece en la tabla C. 
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Ejercicios de la seccion 


6. ^Cuales son las cuatro caracteristicas de una distribucion binomial? De por lo menos tres ejemplos relacionados 
con negocios. 

7. El 10% de los discos de computador producidos por un nuevo proceso salen defectuosos. Si hay 20 discos 
en una caja: 

a. £ Cuantos esperarfa usted que salieran defectuosos? 

b . ^Cual es la probabilidad de que el numero de discos defectuosos sea igual al numero esperado que usted 
determino en su respuesta a la parte al 

8 . Del problema anterior, ^cual variation se encontrana en los discos defectuosos de una caja a otra? 

9. S61o 20% de los empleados de la poblacion civil que esta en una base militar restringida porta su identificacion 
personal. Si llegan 10 empleados, cual es la probabilidad de que el guardia de seguridad encuentre: 

a . ^Ocho empleados con identificacion? 

b. ^Cuatro empleados con identificacion? 

c. ^Por lo menos 4 empleados con identificacion? 

d. lo sumo 5 empleados con identificacion? 

e. ^Entre 4 y 7 empleados inclusive con identificacion? 

10. Responda la pregunta anterior si 60% de todos los empleados portan identificacion. 

11. Usted ha contratado 8 recepcionistas telefonicas para que tomen los pedidos telefonicos para una linea de 
productos deportivos que su empresa esta comercializando. Una recepcionista esta ocupada el 30% del 
tiempo catalogando un pedido. Usted no desea que la probabilidad de que una llamada del cliente se reciba 
con una senal de ocupado exceda del 50%. ^Deberia usted contratar mas recepcionistas si 3 clientes llaman? 

12. Un estudiante debe obtener por lo menos el 60% en un examen de verdadero y falso con 1 8 preguntas por 
responder. Si el estudiante lanza una moneda para determinar la respuesta a cada pregunta, ^cual es la 
probabilidad de que el estudiante pase? 


5.4 La distribucion hipergeometrica 

Como se acaba de explicar, la distribucion binomial es apropiada solo si la probabilidad de un exito permanece 
constante para cada intento. Esto ocurre si el muestreo se realiza con reemplazo o de una poblacion finita (o muy 
grande). Sin embargo, si la poblacion es pequena y ocurre el muestreo sin reemplazo, la probabilidad de un exito 
variara. Si la probabilidad de un exito no es constante, la distribucion hipergeometrica es de especial utilidad. La 
funcion de probabilidad para la distribucion hipergeometrica es: 


Distribucion p ^ _ A N-fin-x 

hipergeometrica t£ n 


[5.6] 


en donde N 
r 
n 


es el tamano de la poblacion 

es el numero de exitos en la poblacion 

es el tamano de la muestra 

es el numero de exitos en la muestra 


x 
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La distribution hipergeometrica Si se selecciona una muestra sin reemplazo de una 
poblacion finita conocida y contiene una proportion relativamente grande de la 
poblacion, de manera que la probabilidad de exito sea perceptiblemente alterada de 
una selection a la siguiente, debe utilizarse la distribution hipergeometrica. 


Supongamos que en un establo de caballos de carrera hay N = 10 caballos, y r = 4 de ellos tienen una 
enfermedad contagiosa. ^Cual es la probabilidad de seleccionar una muestra de n = 3 en la cual x = 2 caballos 
enfermos? 

P(X = 2) = & u=&= 2 

10^3 

_ 

" 120 
= 0.30 

Existe un 30% de probabilidad de seleccionar tres caballos de carreras, dos de los cuales estan enfermos. 


Ejemplo 5.3 Uso de la distribution hipergeometrica para analizar la discrimination 

En un caso reciente en el Distrito de Johnson en Kansas City, tres mujeres entablaron una demanda 
contra una empresa de servicios locales, por discriminacion de sexos. De las nueve personas que 
eran elegibles para un ascenso, cuatro eran mujeres. Tres de las nueve personas recibieron en 
realidad el ascenso; pero solo una de ellas era mujer. Las otras tres mujeres elegibles demandaron. 
Una consideration importante en el caso, unida con la probabilidad de que de las tres personas que 
recibieron ascenso solo una mujer fuera seleccionada por casualidad. Es decir, si el genero no era 
un factor, ^cual es la probabilidad de que no mas que uno de los tres ascensos fuera asignado a una 
mujer? 


Solution 

Un consultor economico especializado en asuntos legales fue llamado por el abogado defensor 
para refutar los cargos. El economista calculo la probabilidad de que ante la ausencia de 
discriminacion, solo una de las mujeres serfa ascendida en su cargo. Este calculo se baso en que 

N= 9; el numero de personas elegibles para ser ascendidas 
r = 4; el numero en la poblacion identificado como exitos (mujeres) 
n = 3 ; tamano de la muestra (quienes fueron seleccionados para el ascenso) 
x <1 ; el numero de exitos (mujeres) en la muestra. 

La probabilidad de que no mas que una mujer fuera ascendida es P(X =0) + P(X =1). 

P(X = 1) = = 121 1 2 = 0.4762 

<A 8 4 

, . dCn.C, 1 X 10 

P{X = 0) = = — — - = 0.1 190 

9 C 3 84 

Por tanto, P(X< 1 ) = 0.4762 + 0. 1 1 90 = 0.5952. 

Interpretation 

Habla casi un 60% de probabilidad, sin considerar el genero que, no mis de una mujer fuera 
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ascendida. Con base en tales hallazgos, como con otras pruebas presentadas en el caso, la corte 
dictamino que no habia suficiente evidencia de discriminacion. 


A. Uso del computador 

Excel funciona casi como magia en la solucion de las distribuciones hipergeometricas. Simplemente haga clic en 
INSERTAR > FUNCION > ESTADISTIC AS > DISTR. HIPERGEOM. Luego ingrese los valores para i,«,ry N. 
La respuesta aparecera en la casilla Valor. 


Ejercicios de la seccion 


13 . Como subgerente de su empresa de materias primas, usted debe contratar 10 personas entre 30 candidates, 
22 de los cuales tienen titulos universitarios. ^Cual es la probabilidad de que 5 de los que usted contrate 
tengan un titulo? 

14 . De los 15 altos ejecutivos de un negocio de importaciones y exportaciones, se seleccionan 12 para ser 
enviados al Japon a estudiar un nuevo proceso de produccion. Ocho de los ejecutivos ya tienen algo de 
entrenamiento en el proceso. <;,Cual es la probabilidad de que 5 de los enviados tengan algo de conocimiento 
sobre el proceso antes de partir para el lejano oriente? 

15 . Cuarenta trabajadores de su oficina han recibido nuevos computadores. Veintisiete tienen la nueva tecnologia 
MMX. Si se seleccionan 10 aleatoriamente, ^cual es la probabilidad de que 3 esten equipados con MMX? 

16 . Una encuesta de la re vista Fortune (marzo 17 de 1997) sirve como fuente para este problema, que su supervisor 
le solicita que resuelva. De los 10 empleados hombres, 7 tenian esposas que tambien trabajaban. ^Cual es la 
probabilidad de que a lo sumo un esposo tenga una esposa que este empleada fuera de casa si se seleccionan 
3 trabajadores al azar? 

17 . Del problema anterior, la encuesta revel 6 que 6 de los 10 empleados ganaban mas de US$95,000 al ano. De los 
3 seleccionados, ^cual es la probabilidad de que todos tres ganen mas de US$95,000? 


5.5 La distribucion de Poisson 

Una variable aleatoria discreta de gran utilidad en la medicion de la frecuencia relativa de un evento sobre alguna 
unidad de tiempo o espacio es la distribucion de Poisson. Con frecuencia se utiliza para describir el numero de 
llegadas de clientes por hora, el numero de accidentes industriales cada mes, el numero de conexiones electricas 
defectuosas por milla de cableado en un sistema electrico de una ciudad, o el numero de maquinas que se danan 
y esperan ser reparadas. 


Distribucion de Poisson Ideada por el matematico trances Simeon Poisson (1781 - 
1840), la distribucion de Poisson mide la probabilidad de un evento aleatorio sobre 
algun intervalo de tiempo o espacio. 


Son necesarios dos supuestos para la aplicacion de la distribucion de Poisson: 

La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o espacio. 
La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera. 
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Dados estos supuestos, la funcion de probabilidad de Poisson puede expresarse como 


Funcion de probabilidad , 

de Poisson x ~ x\ 


[5.7] 


en donde x 

e 


es el numero de veces que ocurre el evento 

es el numero promedio de ocurrencias por unidad de tiempo o de espacio 
= 2.7 1 828, la base del logaritmo natural. 


Supongamos que se esta interesado en la probabilidad de que exactamente 5 clientes lleguen durante la 
siguiente hora (o en cualquier hora dada) laboral. La observation simple de las ultimas 80 horas ha demostrado 
que 800 clientes han entrado al negocio. Por tanto, fi = 10 por hora. Utilizando la formula (5.7), 


P( 5) = 


(10) 5 X 2.71828“ 10 
5! 


0.0378 


Debido a que esta formula es poco practica, las probabilidades para los valores seleccionados se dan en la tabla 
D. Dirfjase al extremo superior de la tabla hasta encontrar = 10. Baje por esa columna hasta la fila en donde esta 
x = 5. Alii usted encontrara 0.0378. Existe 3.78% de oportunidad de que exactamente 5 clientes ingresen a la tienda 
durante la siguiente hora. 

Una compama de pavimentacion local obtuvo un contrato con el Ayuntamiento para hacer mantenimiento a 
las vfas de un gran centro urbano. Las vias recientemente pavimentadas por esta compama demostraron un 
promedio de dos defectos por milla, despues de haber sido utilizadas durante un ano. Si el condado sigue con esta 
compama de pavimentacion, ^cual es la probabilidad de que se presenten 3 defectos en cualquier milla de via 
despues de haber tenido trafico durante un ano? 


/>(!) = 2 3 X 2.71828 ~ 2 


= 0.1804 


o 1 8.04%. Para utilizar la tabla D, halle la columna en donde /x = 2 y la fila en donde x = 3 . Alii encontrara el valor 
de 0.1 804. 

Se supone por el momento que se desea conocer la probabilidad de 3 defectos en 0.5 millas. Debido a que se 
da la media en ocurrencias por una milla (2 por milla) es necesario ajustar jJ, de acuerdo con la estipulacion en el 
problema de 0.5 millas. Se debe determinar que porcentaje es 0.5 millas de una milla = 0.5/1= 0.5. Entonces la media 
en ocurrencias para este problema es /n = (0.5) (2 ocurrencias) = 1. Si el promedio es de 2 por milla, va a ser 1 por 
media milla. Por tanto, P(X =3 I fi = 1) = 0.0613. Vale la pena observar el ejemplo 5.4, especialmente la parte c. 

Tambien debe notarse que si en el problema los valores exceden los rangos limitados en la tabla D, es posible 
trabajar el problema con calculadoras manuales recordando la regia de exponentes : = Me^. Entonces, 


P(X = 3|/*= D = ^ 
x! 

I 3 


( 1 ) 


= 0.0613 


2.71 828 ~ 
3! 


2.71828 1 

3! 
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Ejemplo 5.4 Una distribucion de Poisson para estudiantes prudentes 

El profesor Bradley anima a sus estudiantes de estadistica a “actuar de forma prudente” consultando 
al tutor si tienen alguna pregunta mientras se preparan para el examen final. Parece que la llegada de 
los estudiantes a la oficina del tutor se ajusta a una distribucion de Poisson, con un promedio de 5.2 
estudiantes cada 20 minutos. El profesor Bradley esta preocupado porque si muchos estudiantes 
necesitan los servicios del tutor, puede resultar un problema de congestion. 

a. El tutor debe determinar la probabilidad de que cuatro estudiantes lleguen durante cualquier 
intervalo de 20 minutos, lo cual podrfa causar el problema de congestion que teme el profesor 
Bradley. Si la probabilidad excede el 20%, se contratara un segundo tutor. 

b. El tutor debe calcular la probabilidad de que mas de cuatro estudiantes lleguen durante algun 
perfodo de 20 minutos. Si es mayor que el 50%, las horas de oficina del tutor se aumentaran, 
permitiendo a los estudiantes extender el horario en las que vienen a ver al tutor. 

c. Si la probabilidad de que mas de siete estudiantes lleguen durante un perfodo cualquiera de 30 
minutos excede 50%, el mismo profesor Bradley ofrecera tutorfa adicional. 

Solucion 

P(X = 4| M = 5.2) = 0.1681 

b. P(X > 4 1 ^ = 5.2) 

= 1 -/>(Y<4|/a = 5.2) 

= 1 - [P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P{X = 4)] 

= 1 - [0.0055 + 0.0287 + 0.0746 + 0.1293 + 0.1681] 

= 0.5938 

c. Se tiene que fi = 5.2 por cada 20 minutos. La estipulacion del profesor cubre un perfodo de 30 
minutos. Se debe determinar que porcentaje es 30 de 20:30/20 =1.5. 

Entonces, /t para cada 30 minutos es 5.2(1 .5) = 7.8. Asi, pues: 

m>7|/n = 7.8)= 1 -[«<?)] 

= 1 - [/>(* = 0) + • • • + P(X = 7)] 

= 0.5188 


Interpretacion 

Debido a que P(X = 4) = 0. 168 1 < 20%, un segundo tutor es innecesario. P(X > 4) = 0.5938 > 50%; las 
horas de oficina del tutor se extenderan. Y P(X > 7) = 0.5 1 88 > 50%; el profesor Bradley ayudara en 
la tarea de tutorfa. 


A. Uso del computador 

Las probabilidades de Poisson pueden obtenerse tambien utilizando Minitab y Excel. Se supone que se desea 
determinar la probabilidad de que 4 estudiantes lleguen a la oficina del tutor de la parte a del ejemplo 5.4. Para 
obtener las probabilidades de Poisson con Minitab, ingrese 4 en la columna (1) de la hoja de trabajo. Seleccione 
Calc >Probability Distribution Poisson > Probability. Ingrese 5.2 en la casilla de Mean y Cl en la casilla de Input 
Column. 

Para utilizar Excel, seleccione Insertar > Fund on > Estadisticas> Poisson. Haga clic en Aceptar. Ingrese 4 en 
la casilla x, 5.2 en la casilla Media y Falso en la casilla Acumulado. La respuesta aparecera en la casilla de Valor en 
la esquina superior derecha. 
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Ejercicios de la seccion 


18. A un conmutador de la oficina principal de la compama llegan llamadas a un promedio de dos por minuto y se 
sabe que tienen distribution de Poisson. Si el operador esta distraido por un minuto, cual es la probabilidad 
de que el nilmero de llamadas no respondidas sea: 

a. ^Cero? 

b. iPov lo menos una? 

c. ^Entre 3 y 5, inclusive? 

19. ^Cuales serian las probabilidades en el ejercicio 18 si el operador se distrae por 4 minutos? 

20. Un proceso de fabrication utilizado para hacer artefactos plasticos Incas presenta una tasa de defectos de 5 
por cada 100 unidades. Las unidades se envian a los distribuidores en lotes de 200. Si la probabilidad de que 
mas de 3 salgan defectuosos supera el 30%, usted planea vender en su lugar, camisetas Grateful Dead. ^Cual 
artfculo agregara usted al inventario? 

21. Usted compra partes para bicicleta de un proveedor en Toledo que tiene 3 defectos por cada 100 partes. Usted 

esta en el mercado para comprar 150 partes pero no aceptara una probabilidad de mas del 50% de que mas de 
dos partes sean defectuosas. ^Usted le compraiia a dicho proveedor? 


5.6 La distribution exponential 

Como se acaba de observar, la distribution de Poisson es una distribution discreta que mide el numero de 
ocurrencias sobre algun intervalo de tiempo o espacio. Describe por ejemplo, el numero de clientes que pueden 
llegar durante algun perfodo determinado. Por el contrario, la distribution exponencial es una distribution continua. 
Mide el paso del tiempo entre tales ocurrencias. Mientras que la distribution de Poisson describe las tasas de 
llegada (de personas, camiones, llamadas telefonicas, etc.) dentro de algun perfodo dado, la distribution exponencial 
estima el lapso entre tales arribos. Si el numero de ocurrencias tiene distribution de Poisson, el lapso entre las 
ocurrencias estara distribuido exponencialmente. 

La probabilidad de que el lapso sea menor que o igual a cierta cantidad x es 


Distribution exponencial P(X<x) = \-e m 


en donde t es el lapso de tiempo 

e es la base del logaritmo natural 2.7 1 828 
jU es la tasa promedio de ocurrencia 

La distribution de una variable aleatoria exponencial se muestra en la figura 5.2. La curva en continuo descenso 
muestra que con el paso del tiempo X aumenta, y la probabilidad disminuye. 

fix) 

Figura 5.2 
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La probabilidad de que pasen 30 minutos entre ocurrencias excede la probabilidad de que pasen 40 minutos: P(X 
< 30) >P(X <40). Esto se debe a que siempre deben pasar 30 minutos antes que pasen 40. 

Asi como se tiene que ajustar la tasa promedio de llegada para ajustar la estipulacion de Poisson, es necesaria 
una correction para la distribucion exponencial. Sin embargo, aqui es mas facil ajustar el valor para el tiempo t en 
la formula (5.8) para ajustar el marco de tiempo estipulado en el problema. Se asume que la tasa promedio de 
llegada de los clientes es ji - 1 .5 por hora y se desea saber la probabilidad de que no mas de dos horas transcurran 
entre llegadas. Usando la formula (5.7), t es 2. Entonces P(X <2)=\-e -< 1 5)(2) = 1 - e\ La solucion puede hallarse 
en la mayorfa de las calculadoras manuales como e~ 3 = 1/ e 3 = 0.0498. Se puede querer hacer uso de la tabla de 
Poisson (tabla D) asi como se hizo con la solucion de los problemas de Poisson. El secreto es establecer que a; = 
0, la tabla D revela que e 3 = 0.0498. La probabilidad de que no mas de dos horas transcurran entre la llegada de los 
clientes es 1 - 0.0498 = 0.9592. Existe 95.02% de probabilidad de que el segundo cliente ingrese a las dos horas o 
menos del primero si la tasa promedio de llegadas es de 1.5 por hora. 

Los camiones llegan al puerto de carga a una tasa de p - 2 por hora. ^Cual es la probabilidad de que no mas de 
30 minutos transcurran entre llegadas? La tasa promedio de llegada esta dada por hora, o 60 minutos, y el 
problema se plantea en minutos (30 de ellos). Para evitar “el asunto de las manzanas y las naranjas” se debe hallar 
que porcentaje de 60 minutos son 30. Asi t - 30/60 = Vi. Entonces, P(X < 30 minutos) = 1 - e ' (2)(l/2) = 1 - e 2 
utilizando una calculadora o confiando en la tabla D estableciendo que x = 0, se tiene que 1 - 0. 1353 = 0.8647. 


Ejemplo 5.5 

Cross City Cab Company programa sus taxis para que lleguen al aeropuerto local en una distribucion 
de Poisson con una tasa promedio de llegada de 12 por hora. Usted acaba de aterrizar en el 
aeropuerto y debe llegar al centro a cerrar un gran negocio. Cual es la probabilidad de que usted 
tenga que esperar maximo 5 minutos para conseguir un taxi? Su jefe es un tirano que no tolerara la 
falla, de manera que si la probabilidad de que pase otro taxi dentro de 5 minutos es menor al 50%, 
usted alquilara un carro para el viaje a la oficina. 

Solucion 

Asumiendo lo peor, que el ultimo taxi acaba de irse, usted debe determina P(X < 5 minutos). Debido 
a que p = 12 por 60 minutos, usted debe determinar a que porcentaje son 5 minutos de 60:5/60 =1/ 
12. Por lo tanto, t = 1/12 y P(X <5)=l-e ' (12)(1/12) = 1 - e l . Con una calculadora o utilizando la tabla 
D se determina P(X< 5) = 1 - 0.3679 = 63.21%. 

Interpretation 

Usted puede relajarse y esperar el taxi, hay una probabilidad de 63.21% (>50%) de que llegue uno 
dentro de 5 minutos. Mientras espera el taxi, debe considerar que la probabilidad de que llegue uno 
entre 5 y 10 minutos es igual a P(X < 10)- P(X < 5). Usted tambien puede desear matar el tiempo 
revisando sus reglas algebraicas de exponentes en caso de que el exponente para e no funcione de 
manera conveniente para un agradable y respetable numero entero como ocurrio anteriormente. 
Vale la pena recordar que e~* = p y e~ i)A = <T 4/, ° = i/H/'e 4 . 


A. Usando el computador 

Excel nuevamente prueba su valor al calcular probabilidades exponenciales. Simplemente haga clic en Insertar > 
Funcion >Estadisticas> Distr. exp. Una vez ingresado el valor ajustado de t en la casilla x, la media en la casilla de 
Lambda y Verdadero en la casilla de Acum, entonces de inmediato la respuesta aparece en la casilla de Valor. 
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Ejercicios de la seccion 


22. Los aviones llegan al pequeno aeropuerto en Puerto Vallarta, Mexico, a una proportion de dos por hora. 
Tomara una hora reparar una rampa utilizada para desembarcar pasajeros. ^Cual es la probabilidad de que un 
avion llegue mientras que la rampa esta en reparation? 

23. El computador principal de la universidad queda fuera de linea tres veces por semana. El profesor Mundane 
debe completar un proyecto esta semana que requiere del computador. ^Cual es la probabilidad de que el 
computador este fuera de linea toda la semana? 

24. En el ejercicio 23, £cual es la probabilidad de que el computador este fuera de linea por cualquier perfodo de 
dos semanas? 

25. Durante un dia de trabajo tipico de 8 horas, los computadores utilizados para vigilar la etapa de enfriamiento 
en la production de neumaticos para autos senala que la temperatura no se mantiene de forma apropiada en 
30 oportunidades. El Sr. Radial, director ejecutivo de la compama, esta por hacer una inspection de la planta 
durante 30 minutos. ^Cual es la probabilidad de que este alii cuando se active la serial del computador? 

26. En el ejercicio 25, £cual es la probabilidad de que la visita del Sr. Radial sea interrumpida por la serial del 
computador? 


5.7 La distribucion uniforme 

La distribucion de probabilidad uniforme es una distribucion en la cual las probabilidades de todos los resultados 
son las mismas. El experimento de lanzar un dado ilustrado en la tabla 5.2 es uno de los ejemplos. Todos los seis 
resultados teman 1/6 de probabilidad de ocurrencia. La figura 5.3 muestra una distribucion uniforme en la cual 
todos los resultados sobre el rango total de posibilidades de distribucion son igualmente posibles, desde el 
minimo de a hasta el maximo de b. 


■ 7 : : — 

- " 
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Distribucion uniforme En una distribucion uniforme las probabilidades son las 
mismas para todos los posibles resultados. 


La media o valor esperado de una distribucion uniforme esta a mitad de camino entre sus dos puntos extremos. 
Asi: 
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en donde a y b son los valores mas bajo y mas alto, respectivamente. 
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La varianza es: 


Varianza de una distribucion 

2 (b - a) 2 
a - 

[5.10] 

uniforme de probabiiidad 

12 



El area total bajo la curva, como en el caso de todas las distribuciones de probabiiidad, debe ser igual a 1 o 
100%. Debido a que el area es la altura por el ancho, la altura es 


Altura = 


Area 

Ancho 


y por tanto 


Altura = 

[5.11] 

b — a 



en donde b - a es el ancho o rango de la distribucidn. 

Suponga que los contenidos de las latas de 16 onzas de fruta enlatada producida por Del Monte oscila entre 
14.5 y 17.5 onzas y se ajusta a una distribucion uniforme. Esto se muestra en la figura 5.4. La media es 


14.5+17.5 ^ 

fx = r = 16 onzas 


y la altura es 


A "" ra “ JT.5 11? ' 1/3 


Figura 5.4 
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Asuma que Del Monte desea saber la probabiiidad de que una sola lata pese entre 16 y 17.2 onzas. Este valor 
esta dado por el area dentro de ese rango tal y como se muestra en la figura 5.4. La probabiiidad de que una 
observacion Unica este comprendida dentro de dos valores X } y X 2 es 


Probabiiidad de que una observacion , < x =s x ) = — ~ — 

caiga entre dos valores 1 2 rango 
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Para la lata de Del Monte, se tiene 


P(16<X< 17.2) = 


17.2 - 16 
17.5 - 14.5 
0.40 


Ejemplo 5.6 

Dow Chemical produce un fertilizante inorgdnico para c£sped, para aquellos quienes fertilizan su 
pasto en casa, de manera que lo puedan podar con mas frecuencia. Este tipo de fertilizante se vende 
en bolsas con un peso uniformemente distribuido, con una media de 25 libras y un rango de 2.4 
libras. Harry Homeowner necesita 23 libras para fertilizar su cesped, pero duda si comprar s61o una 
bolsa ya que se desvia de las 25 libras en un rango de 2.4 libras. Tambi6n tiene curiosidad sobre la 
probabilidad de comprar una bolsa con mds de 25.5 libras. 


Solucion 

Si las bolsas tienen un promedio de 25 libras sobre un rango de 2.4 libras, entonces la mitad de ese 
rango, o 1.2 libras, debe estar por debajo de 25, y la otra mitad, por encima de 25 libras. Por 
consiguiente, el peso minimo serd 25 - 1.2 = 23.8 libras y el peso maximo es 25 + 1.2 = 26.2 libras, 
como se observa en la figura. La probabilidad de seleccionar una sola bolsa que contenga entre 25.5 
y 26.2 libras es 

Pi 25.5 < X < 26.2) = 26 ' 2 2 ~ 25-5 = 0.2917 

m i 



23.8 fi = 25 25.5 26.2 


Interpretacion 

Harry no tiene que preocuparse. La bolsa mas liviana que podria comprar pesa 23.8 libras. 
Definitivamente comprara por lo menos las 23 libras que necesita para su cesped. Ademas, la 
probabilidad de seleccionar una bolsa con mas de 25.5 libras es 29.17%. 


A. Usando el computador 

Minitab puede utilizarse de manera efectiva para determinar probabilidades uniformes. Ingrese los valores para 
los cuales desea hallar las probabilidades en la Columna ( 1). Haga clic en Calc. > Probability Distribution>Uniform 
> Cumulative Probability. Ingrese los valores mas bajo y m£s alto y Cl en la casilla de Input Column. 


Ejercicios de la seecion 


27. Generalmente le toma entre 1 .2 y 1 .7 horas aproximadamente hacer su tarea de estadistica. Los tiempos estan 
distribuidos de manera uniforme. ^Qu6 tan probable es que usted termine a tiempo para reunirse con sus 
amigos dentro de 1.4 horas? 
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28. Las latas de alimento para perros Happy-Tale tienen un promedio de 16 onzas, con un rango de 4.2 onzas. 

a. ^Cual es la lata mas pequena en onzas que usted puede comprar para Weiner, su peiro de raza poodle toy? 
<[,Cual es la lata mas grande que usted puede comprar para su perro lobo llamado Killer? 

b. iS i usted selecciona una lata al azar, cual es la probabilidad de que pese entre 15.8 y 16.5 onzas? 

29. El agua utilizada por Auto-Brite para lavar los carros es de 30 galones por carro. Lo menos que se utiliza son 
27 galones, y su uso esta distribuido uniformemente. Una encuesta muestra que los carros no quedan limpios 
a menos que se utilicen 32 galones de agua en la lavada. ^Que porcentaje de carros que salen de Auto-Brite 
queda limpios? 

30. El tiempo requerido para conseguir una pista en una bolera local oscila entre 23.5 y 40.5 minutos. Asumiendo 
una distribucion uniforme, si la probabilidad de que usted tenga que esperar mas de 30 minutos excede del 
60%, usted piensa jugar golf. ^Cual bolsa deberfa colocar en su baul, la bolsa de golf o la de bolos? 

31. Debido a que usted decidio jugar golf, dada su respuesta a la pregunta anterior, usted aprende que el tiempo 
promedio para jugar 18 hoyos en esta cancha es de 4.2 horas. La persona que completo este trayecto mas 
rapidamente fue Rapid Roy Parr, quien tomo 2.9 horas. Si los tiempos estan distribuidos uniformemente, ^cual 
es la probabilidad de que usted termine a tiempo para llegar a casa para ver el juego de futbol entre Pittsburgh 
Steelers y Denver Broncos que comienza en 4 horas? 


5.8 La distribucion normal 


De todas las distribuciones de probabilidad que se analizaran, la distribucion normal es la mas importante. En el 
capftulo 3 se hizo una introduction a la naturaleza basica de la distribucion normal, su caracteristica simetrica en 
fonna de campana y la forma como se relacionaba con la regia empirica. En este momento debe recordarse que la 
distribucion normal es una distribucion continua (no discreta). Se utiliza para reflejar la distribucion de variables 
tales como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. Tales variables continuas 
generalmente son el resultado de la medida. 

Consideremos un caso en el cual ToppsWear, un gran fabricante de ropas, desea estudiar la distribucion en la 
estatura de las personas. Topps Wear reconocio que el publico estaba en constante cambio en su tamano fisico 
y en sus proporciones. En un esfuerzo por producir la ropa de mejor ajuste, la gerencia sintio que se necesitaba un 
analisis completo de las tendencias actuales en los tamanos de moda. Se supone que si Topps Wear fuera a medir 
las estaturas de todos sus clientes potenciales, encontrarfan que las estaturas estan distribuidas normalmente 
alrededor de una media de 67 pulgadas. Es decir, que mientras que la estatura promedio es de 67 pulgadas, algunas 
personas son mas altas y algunas mas bajas. Esta dispersion por encima y por debajo de la media podrfa medirse 
mediante la desviacion estandar que se calculo en el capftulo 3. Se asume que la desviacion estandar eri las 
estaturas de los clientes es de 2 pulgadas. 

Una grafica de estas estaturas producirfa la habitual forma de campana. La figura 5.5 muestra esta grafica, 
colocando las observaciones individuates en el eje horizontal, y la frecuencia con la cual cada una de estas 
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observaciones ocurrieron en el eje vertical. Si los valores son todavia normales (ej: distribuidos normalmente), 
entonces aparecera la curva en forma de campana. Vale la pena recordar que mas del 50% de las observaciones 
(estaturas) estan por encima de la media y el 50% de estas estan debajo de la media. Similarmente el 50% de toda 
el area bajo la curva normal esta a la derecha de la media y el 50% de esta area esta a la izquierda de la media. Esto 
se observa tambien en la figura 5.5. 


A. Comparacion entre distribuciones normales 

La forma y position de una distribucion normal estan determinadas por dos parametros: su media jU y su desviacion 
estandar a. La figura 5.6 muestra tres distribuciones normales diferentes de las tallas que ToppsWear puede 
encontrar en su estudio sobre las tendencias de la moda. La primera (I) corresponde a las distribuciones descritas 
anteriormente, las cuales tienen una media de fj. = 67 y una desviacion estandar de <7- 2. Esta centrada en 67 con 
la mitad de las observaciones por encima de 67 y la mitad por debajo. La desviacion estandar de 2 indica el grado 
en el cual las observaciones estan dispersas por encima y por debajo de 67. 
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La segunda distribucidn (II) tiene una media mas alta, de ju = 79, pero la misma desviacion estandar de <J= 2. 
Por tanto, esta centrada mas hacia la derecha, directamente encima de 79. Pero como tiene el mismo grado de 
dispersion (cr= 2), toma la misma forma que la primera distribucion. 

Una tercera distribucion (III) tiene la misma media que la primera (fl = 67) y por tanto esta centrada en el mismo 
sitio. Sin embargo, su medida de dispersion es mas grande, tal y como lo indico la desviacion estandar de a = 4. 
Las observaciones varfan por encima y por debajo de dicha media de 67 hasta un grado mayor que las observaciones 
de la primera distribucion. Por tanto, la distribucion III es mas plana y mas dispersa por encima y por debajo de la 
media de 67. 
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A pesar de sus diferencias, las tres son distribuciones normales. Son simetricas y en forma de campana. 
Ademas, como conjuntos de datos normalmente distribuidos, la regia empirica que se analizo en el capitulo 3 se 
aplica a cada distribucion. La regia empirica especifica que, sin considerar el valor de la media o la desviacion 
estandar, 

El 68.3% de todas las observaciones esta a una desviacion estandar de la media. 

El 95.5% de todas las observaciones esta a dos desviaciones estandar de la media. 

El 99.7% de todas las observaciones esta a tres desviaciones estandar de la media. 

La figura 5.6 ilustra la regia empirica. Vale la pena destacar que para los tres conjuntos de datos, sin considerar el 
valor de ji o a, el 68.3% de todas las observaciones esta a un crde jx. Comparando la primera distribucibn (I) con 
la tercera (III). Debido a que la tercera distribucibn esta altamente dispersa, es necesario tomar un intervalo mas 
amplio para incluir la misma proporcion de observaciones. Mientras que la primera distribucion incluye el 68.3% 
de todas las observaciones dentro del intervalo 65 a 69, la tercera distribucion comprende este mismo porcentaje 
s61o dentro de un intervalo m&s amplio de 63 a 71. 

Incluir un cierto porcentaje de todas las observaciones dentro de un intervalo, significa tambien abarcar el 
mismo porcentaje de toda el drea que esta debajo de la curva dentro de dicho intervalo. Por tanto, mientras que el 
intervalo de 65 a 69 contiene el 68.3% de todas las observaciones en la primera distribucion, ese mismo intervalo 
tambien contiene el 68.3% de toda el area que esta debajo de la curva normal. 


B. La desviacion normal 

Puede existir un numero infinito de distribuciones normales posibles, cada una con su propia media y su desviacion 
estandar. Ya que obviamente no se puede analizar un numero tan grande de posibilidades, es necesario convertir 
todas estas distribuciones normales a una forma estandar. Esta conversion a la distribucion normal estandar se 
efectua con la formula de conversion (o formula- Z) 


La desviacion normal x - /x 

o formula-Z z = 


[ 5 . 13 ] 


en donde Z es la desviacion normal y X es algun valor especifico de la variable aleatoria. Despues de este proceso 
de conversion, la media de la distribucion es 0 y la desviacion estandar es 1 . Es decir, sin considerar lo que valen 
la media y la desviacion estandar, se miden en las unidades originales en la distribucion, despues de que se ha 
aplicado la formula de conversion la media es 0 y la desviacion estandar es 1 . 

La figura 5.7 ilustra el uso de los datos de ToppsWear. El eje superior mide las observaciones de estatura X en 
pulgadas. La media es /i = 67 pulgadas, y la desviacibn estandar es a = 2 pulgadas. El eje inferior refleja estas 
estaturas en t^rminos de sus valores de Z. 

Tom Typical mide 67 pulgadas, la estatura promedio de todos los consumidores en el mercado de ropas de 
ToppsWear. Utilizando la formula (5. 13), el valor de Z relacionado con una estatura de X = 67 es 


Z - 


X — fx 


a 


= 67 - 67 
2 

- 0 
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Figura 5.7 
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Esto se puede observar en el eje inferior, o eje Z, en la figura 5.7. Despues de aplicar la formula de conversion, se 
encuentra que la estatura promedio de 67 pulgadas tiene un valor de Z de 0. Si se quisiera convertir la estatura de 
todos los clientes en todo el mercado, se encontrarfa que todos los valores resultantes de Z tendrfan una media de 
cero y una desviacion estandar de 1 . 

Z la desviacion normal, se define como “el niimero de desviaciones estandar a las que una observacion esta 
de la media”. Paula Petite mide 63 pulgadas. Su valor de Z es 

7 63 - 67 

2 

= -2 

Como lo muestra la figura 5.7, 63 pulgadas estan a 4 pulgadas, o 2 desviaciones estandar por debajo de la media. 
Convirtiendo X = 63 pulgadas a su valor de Z resulta -2.00. 


Valor de Z Es el numero de desviaciones estandar a las que una observacion esta por 
encima o por debajo de la media. 


Steve Stretch mide 70 pulgadas. La figura 5.7 revela que convertir 70 pulgadas a un valor de Z resulta 

2 = — - 

= 1.5 

El valor de Z de Steve es 1.5. El esta a 3 pulgadas o 1.5 desviaciones estandar por encima de la estatura promedio 
de 67 pulgadas. ^Cuanto mide Fred si su valor de Z es -1.5? 


C. Calculo de probabilidades con la desviacion normal 

Estandarizar una distribution normal permite determinar mas facilmente la probabilidad de que ocurra cierto 
evento. El personal de ToppsWear puede hallar la probabilidad de que un solo cliente tenga entre 67 y 69 pulgadas 
de estatura, P(61 <X< 69), simplemente hallando el area que esta bajo la curva normal entre 67 y 69. Es decir, si se 
conoce el area se conocera la probabilidad. 

Considerandolo en este sentido, se supone que se estd disparando a un objetivo o bianco, el cual tiene dos 
tercios pintado de verde y un tercio pintado de rojo. Se tiene la misma oportunidad de darle a un punto del objetivo 
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como a cualquier otro punto. No necesariamente debe dar en el centra, s61o al objetivo en general. La probabilidad 
de que pegue en la parte verde es dos tercios. ^Por que? Debido a que dos tercios del area estan pintados de verde. 
Si se conoce el area se conoce la probabilidad. Lo mismo puede decirse para el drea que esta bajo la curva normal. 

El area relacionada con un valor de Z dado puede hallarse en la tabla E del apendice III. La figura 5.8(a) ilustra 
este proceso. Se desea saber el area que esta entre 67 y 69. El valor de Z para 69 es 

= 1.00 

La tabla E proporciona el area bajo la curva desde la media hasta algun valor por encima o por debajo de esta . 
Esta es justamente el area que se quiere. En la tabla E, se halla el valor de Z para 1 .0 Se va hacia la derecha a la 
siguiente columna que comienza con 0.00 para obtener Z = 1 .00. Alii se encontrara la entrada 0.3413. Es decir, el 
34.13% del area que esta bajo la curva esta entre 67 y 69. Hay 34. 13% de probabilidad de que un cliente seleccionado 
aleatoriamente mida entre 67 y 69 pulgadas. 

Aunque la tabla E muestra solamente el &rea desde la media hasta algun valor por encima o por debajo de ella, 
otras probabilidades pueden hallarse facilmente. Suponiendo que ToppsWear debe determinar la probabilidad de 
que un cliente mida mas de 69 pulgadas. Como lo muestra la figura 5.8(6), ya se ha establecido que el 34.13% de 
todos los clientes miden entre 67 y 69 pulgadas. Adem&s, tambien se sabe que el 50% de todos los clientes esta 
por encima de la media de 67. Esto deja 0.5000 - 0.341 3 = 0. 1587 en el area de la cola que va mas alia de 1 .00. Hay un 
15.87% de probabilidad que un cliente escogido aleatoriamente mida mas de 69 pulgadas. 


Figura 5.8 

Areas debajo 
de la curva 
normal 




! I ! I 

0 1 Valores de Z 0 1 Valores de Z 

/>(67 SX<69) = / , (0<ZS2) = 0.3413 P(X > 69) = P(Z > 1) » 0.1587 




- 1 .25 0 1 .65 Valores de Z 0 1 . 1 5 1 .75 Valores de Z 

P(64.5 < X 2£ 70.3) * PO-1.25 ^ Z == 1.65) = 0.8449 P( 69.3 ^ X < 70.5) = P(\A5 < Z < 1.75) - 0.0850 
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La figura 5.8(c), la cual busca el area comprendida entre 64.5 y 70.3, requiere que se calculen los valores de Z. 
Como la tabla dara solamente el area de la media hasta algun valor por encima o por debajo de ella, deben 
determinarse las areas (1) entre 64.5 y 67 y (2) entre 67 y 70.3 y adicionarlas. 

z = 6 4.5 - 67 
- -1.25 

Un valor de Z de 1 .25 (se puede ignorar el signo negativo ya que la curva es simetrica y la mitad de la derecha es 
igual a la mitad de la izquierda) da un area de 0.3944. Para el area comprendida entre 67 y 70.3, se halla 

z = 703 ~ 6 7 
= 1.65 

La tabla E revela que el area es 0.4505. Por tanto, P(64.5 <X< 70.3) = 0.3944 + 0.4505 = 0.8449. La probabilidad de 
que un cliente tenga entre 64.5 y 70.3 pulgadas de estatura es del 84.49%. 

Determinar P( 69.3 < X < 70.5) tambien requiere dos calculos de Z, como se muestra en la figura 5.8 ( d ). Se debe 
determinar el area de 67 a 70.5, la cual incluye el area que se desea y una que no se desea. Luego se calcula el area 
comprendida entre 67 y 69.3 y se resta: 


_ 70.5 - 67 

“ 2 ~ 

= 1.75 


Un valor de Z de 1 .75 da un area de 0.4599. Entonces, 


69.3 - 67 
2 

= 1.15 

lo que produce un area de 0.3749. Entonces P( 69.3 <X< 70.5) = 0.4599 - 0.3749 = 0.0850. 

Vale la pena notar que entre mayor sea el valor de Z, menor sera el area en la cola de la distribucion. La tabla E 
muestra que a medida que Z se aproxima a 3.99, el area abarcada es de virtualmente el 50% por encima de la media, 
dejando muy poco en la cola mas alia de Z = 3 .99. Por tanto, P(Z > 3 .99) ~ 0. 

Incidentalmente, P(X < x) = P(X < x), en donde x es cualquier valor dado. Esto se debe a que la distribucion 
normal es una distribucion continua. Existe un numero infinito de posibles valores que puede tomar X. Por tanto, 
incluir el valor de x no incrementa la probabilidad de que el evento ocurra. 


Ejemplo 5.7 

TelCom Satellite presta servicios de comunicacion a los negocios del area metropolitana de Chicago. 
Los funcionarios de la compama han aprendido que la transmision satelite promedio es de 150 
segundos, con una desviacion estandar de 15 segundos. Los tiempos parecen estar distribuidos 
normalmente. 

Para estimar de manera apropiada la demanda del cliente por sus servicios y establecer una 
estructura de tarifas que maximice las utilidades corporativas, TelCom debe determinar que tan 
probable es que algunas llamadas se presenten. El director de servicios desea que usted proporcione 
estimados de la probabilidad de que una llamada dure: 
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a. Entre 125 y 150 segundos. 

b. Menos de 125 segundos. 

c. Entre 145 y 155 segundos. 

d. Entre 160 y 165 segundos. 


Solucion 

a. 


= 125 Z 150 

15 

= — 1.67 



J L 


-1.67 0 Z 


De la tabla E, un valor Z de 1.67 da un area de 0.4525. Por tanto, la probabilidad de que una 
transmision dure entre 125 y 150 segundos es del 45.25%. 

b. Si el 45.25% del area esta entre 125 y 150, entonces 0.5000 - 0.4525 = 0.0475, o el 4.75% de todas 
las transmisiones requieren menos de 125 segundos. La probabilidad de que cualquier 
transmision seleccionada aleatoriamente requiera 125 segundos o menos es del 4.75%. 

c. 

145 - 150 
15 

= -0.33 



J L 


”0.33 


0 


0.33 


Z 
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Dado Z= -0.33, el drea que esta entre 145y 150 es 0.1293. Debido a que 155estaaunadistancia 
por encima de la media de 1 50 igual a la que 145 esta por debajo de la media, el area entre 150 y 
155 tambidn es 0.1293. Por tanto, P(145 <X< 155) =0.1293 + 0.1293 = 0.2586. 


Z = 


165 - 150 
15 


= 1 



Con Z= 1, el area es 0.3413. Para hallar el area entre 150 y 160, 

160 - 150 
Z ~ ' 15 
= 0.67 

para un areade 0.2486. Por tanto, P(160 <Z< 165) = 0.3413-0.2486 = 0.0927. 

Interpretacion 

Con base en estas probabilidades, es posible para TelCom desarrollar un sentido de la demanda por 
sus servicios que le ayudara a establecer polfticas respecto al uso de los servicios por parte de los 
clientes, asf como tambien una estructura de tarifas Optima que TelCom pueda cobrar. 


D. Calculo de un valor X a partir de una probabilidad conocida 

En la secci6n anterior se pidio calcular una probabilidad dado un valor de X. Es decir, que se proporcionaba el 
valor X para la variable aleatoria, y se debia hallar el area comprendida entre dicho valor y la media. Sin embargo, 
algunas veces se puede saber cual probabilidad se requiere, y debe determinarse que valor de X dar& dicha 
probabilidad. Por ejemplo, se asume que los asesores econdmicos del presidente proponen un programa de 
bienestar social para ayudar a los desfavorecidos, el cual consta de un pago monetario al 15% de los mas pobres 
de la nation. Entonces surge la pregunta sobre que nivel de ingresos separa el 15% m£s pobre del resto de la 
gente. En 1996, el ingreso promedio por persona, medido en dolares, en el ano de 1982 era de US$13,8 12. Se asume 
una desviacion estandar de US$3,550. Esto se muestra en la figura 5.9. ^Existe algun nivel de ingreso que aparezca 
como “?” que separe el 15% mas pobre del 85% restante? Se asume que los ingresos estan distribuidos normalmente. 

Como se muestra en la figura 5.9, se conoce el area y se busca el valor correspondiente para X que est£ 
representado por un signo de interrogation. En problemas anteriores se calculd un valor de Z y se utilizd para 
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Figura 5.9 

Ingresos del 15% 
mas pobre 


a = 3,550 



l L 

-1.04 0 


Ingreso en 1996 (en dolares) 


Z 


buscar el area en la tabla. En esta oportunidad se tiene un area y se puede utilizar la tabla E para buscar el valor 
correspondiente de Z. Aunque se esta interesado en el valor de 0.15, se busca 0.3500 (0.5 - 0.15), ya que solo el 
area de la media a algun valor por encima o por debajo de ella esta dado en la tabla. Se busca en la estructura 
interna de la tabla E el area de 0.3500. Lo mas proximo que se obtiene es 0.3508, lo que corresponde a un valor de 
Z de 1.04. (La extrapolation puede utilizarse cuando se requiere un grado mayor de exactitud). Debido a que 


Z - 


X - jx 
a 


y a que se hallo un valor Z de 1.04, se tiene que 


— 1 .04 


X -J_3,812 
3,550 


Cuando se despeja X y se halla X - US$10,120. Cualquiera con un ingreso de US$10,120 o menos recibira el 
subsidio del gobiemo. 

Vale la pena destacar el signo negativo para el valor de Z. El signo algebraico Z no fue importante en problemas 
anteriores simplemente porque se utilizo el valor de Z para buscar un area en la tabla E. Sin embargo, este no es 
nuestro caso. En esta ocasion, el valor de Z se utiliza para calculos matematicos adicionales para despejar X. Por 
consiguiente, su signo si es de importancia. La regia general es que si se trabaja con el area a la izquierda de la 
media, el signo siempre es negativo. 


Ejemplo 5.8 Mejorando la prevention urbana contra incendios 

Se ha creado una comision estatal para reducir los tiempos de respuesta de tres estaciones de 
bomberos. Un grupo de expertos intenta identificar los departamentos de bomberos cuyos tiempos 
de respuesta esten en el 10% mas bajo, o quienes toman mas del 90% de todas las estaciones de 
bomberos en el estudio. Los del primer grupo sirven como modelos para las unidades menos 
eficientes del segundo grupo. 

Los datos muestran que los tiempos promedio de respuesta para una cierta clase de estaciones de 
bomberos es de 12.8 minutos, con una desviacion estandar de 3.7 minutos. 


Solution 

Se asume que los tiempos de respuesta estan distribuidos normalmente; la figura adjunta ilustra el 
problema. Deben determinarse dos tiempos de respuesta. El primero es tan corto que solo el 10% de 
todas las unidades contra incendios llegan al sitio del incendio dentro de dicho lapso. El segundo, 
es tan largo que solo el 10% de las unidades toman el mayor tiempo. La formula Z se utiliza para 
determinar cada valor de X. Para establecer el tiempo de respuesta mas rapido, se observa 0.4000 en 
la estructura interna de la tabla E. Aunque se esta interesado en el 10% mas bajo, se busca 0.4000, 
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<r= 3.7 



ya que la tabla asi esta disenada. La entrada 0.3997 es el valor mas proximo y da un valor de Z de 
1.28. 

Debido a que se esta buscando el valor para X en la cola izquierda, el valor de Z se da en el signo 
negativo apropiado. 

z = hJUt 

X, = 8.06 


y 


z 2 

1.28 

*2 


*2 -M 

a 

X 2 - 12.8 
3.7 
17.54 


El valor de Z para X 2 esta dado en un signo positivo debido a que se busca un valor en la cola 
derecha que es mayor que la media. 

Interpretation 

En esta clasificaci6n s61o el 10% de las estaciones de bomberos respondid a las llamadas en menos 
de 8.06 minutos. Estas unidades de bomberos serviran como programas modelo para el 10% de las 
estaciones de bomberos cuyos recorridos superan los 17.54 minutos. 


E. Aproximacion normal a la distribution binomial 

La distribuci6n binomial involucra una serie de n ensayos que pueden producir (1) un 6xito o (2) un fracaso. La 
probabilidad de un exito se indica como n. Las respuestas pueden hallarse a menudo en la tabla binomial o 
utilizando la formula binomial, formula (5.3). Sin embargo, si n es demasiado grande, puede exceder los confines de 
cualquier tabla y la formula puede ser excesivamente engorrosa. Debe disenarse un metodo altemativo. La 
solution puede hallarse con el uso de la distribucidn normal para aproximar la distribution binomial. Esta 
aproximacion se considera lo suficientemente precisa si nn> 5 y n(l - k) > 5 y si n estd prdximo a 0.50. 

Se considera un sindicato laboral en el cual el 40% de los miembros esta a favor de una huelga. Si se seleccionan 
15 miembros de manera aleatoria, ^cual es la probabilidad de que 10 apoyen un paro? Para la tabla binomial se halla 

P(X — 10 1 « = 15, 7 t = 0.40) = 0.0245 
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Si no se pudiera utilizar la tabla, podria aproximarse a la respuesta utilizando la distribution normal. Primero se 
debe hallar la media jx y la desviacion estandar a de la distribution normal asi 

/x = hit y cr = Vn(ir)(l — it) 

Enestecaso, fi = (15)(0.40) = 6 y a = Vl5(0.40)(0.60) = 1.897. 

Debido a que existe un numero infinito de valores posibles en una distribution normal (o en cualquier 
distribution continua), la probabilidad de que la variable aleatoria sea exactamente igual a algun valor especifico 
como 10, es cero. Cuando se utiliza una distribucion continua para estimar una variable aleatoria discreta, es 
necesario un leve ajuste. Este ajuste, llamado factor de correccion de continuidad, requiere que se trate la 
probabilidad de exactamente 1 0 miembros como el intervalo entre 9.5 miembros y 10.5 miembros. Esto se ilustra en 
la figura 5.10, la cual muestra las probabilidades para cada valor de la variable aleatoria (numero de miembros) 
tomada de la tabla B. 


Figura 5.10 

Aproximacion 
normal a la 
binomial 



La probabilidad de que exactamente 10 miembros esten a favor de una huelga esta representado por el area del 
rectangulo centrado en 10. Vale la pena destacar que el rectangulo se extiende de 9.5 a 10.5. La curva normal esta 
superpuesta sobre los rectangulos. 

Utilizando la distribucion normal para hallar P( 9.5 <X< 10.5), se tiene 


Z = 


9. 5 - 6 
1.897 


1.85 


para un &rea de 0.4678, y 


Z = 


10.5 - 6 
1.897 


2.37 


para un area de 0.49 1 1 . Entonces, P( 9.5 <X< 10.5), = 0.491 1 - 0.4678 = 0.0233, lo cual es una aproximacion muy 
cercana al 0.0245 que se encuentra en la tabla B. 


Ejercicios de la seccion 


32. Los paquetes de cereal Cheerios de General Mills vienen en cajas de 36 onzas que tienen una desviacion 
estandar de 1.9 onzas. Se piensa que los pesos estan distribuidos normalmente. Si se selecciona una caja 
aleatoriamente, cual es la probabilidad de que la caja pese: 
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a . ^Menos de 34.8 onzas? 

b. ^Mas de 34.8 onzas? 

c. ^Entre 34.3 onzas y 38.9 onzas? 

d. ^Entre 39.5 onzas y 41.1 onzas? 

33 . Como ingeniero constructor usted compra bolsas de cemento de un promedio de 50 libras, con una desviacion 
estandar de 5.2 libras. Desde que usted tuvo el accidente escalando una montana, el medico le dijo que no 
levantara nada que pesara mas de 60 libras. ^Deberia usted cargar una bolsa? 

34 . Se publica que los frenos de los nuevos autos de la marca Lambourginis duran un promedio de 35,000 millas 
con una desviacion estandar de 1,1 14 millas. Cual es la probabilidad de que los frenos del auto que usted 
acaba de comprar le duren: 

a. JVlasde 35,000 millas? 

b. ^Menosde 33.900 millas? 

c. ^Menosde 37.500 millas? 

d. ^Entre 35,200 y 36,900 millas? 

35 . Los sobrecostos por actualizacion de computadores en su empresa tienen un promedio de US$23,500, con 
una desviacion estandar deUS$9,400. Como director ejecutivo de la Division de Investigation, usted no 
desea arriesgarse a mas de 34% de probabilidad que el sobrecosto en una actualizacion propuesta recientemente 
exceda de US$25,000. ^Deberia ejecutar la actualizacion? 

36. El promedio de los salarios en los bancos comerciales en Illinois es de US$22,87 por hora, con una desviacion 
estandar de US$5.87. Cual debe ser su salario por hora si desea ganar: 

a . ^Mas que el 80% de todos los empleados? 

b. ^Mas que el 30% de todos los empleados? 

c. ^Menos que el 20% de todos los empleados? 

d. ^Mas que el 50% de todos los empleados? 

37 . Los empleados en Coopers-Price and Lybrand trabajan un promedio de 55.8 horas por semana, con una 
desviacion estandar de 9.8 horas. Los ascensos son mas probables para los empleados que estan dentro del 
10% de los que pasan mas tiempo trabajando. ^Cuanto debe trabajar usted para mejorar sus oportunidades de 
ascenso? 

38 . Los registros muestran que 45% de todos los automoviles producidos por Ford Motor Company contiene 
partes importadas de Japon. ^Cual es la probabilidad de que los proximos 200 carros, 115 contengan partes 
japonesas? 


Problemas resueltos 

1. Distribution binomial. Un fabricante en California le suministra un diseno prototipo para una pieza de 
aeronave que requiere su negocio. Este nuevo producto, que es enviado en lotes de n = 12, sufre de una tasa 
de defectos de 40%. 

a . Si usted no desea un riesgo mayor del 10% en la probabilidad de que 5 de los 12 sean defectuosos ^deberia 
comprarle a ese distribuidor? 

De la tabla B,F('X=5 \n=\2,n= 0.40) = 0.2270 > 10%. No compre. 

b. Si usted no desea enfrentar un riesgo mayor del 20% de probabilidad de que mas de 5 salgan defectuosos, 
deberia comprarle a este proveedor? 
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De la tabla C, P(X > 5 \n= 12, Jt = 0.40)= l-P(X<5 \n = 12, re = 0.40) = 1-0.6652 = 0.3348 >20%.Ustedno 
deberia comprarle a este proveedor. 


2. Distribucion hipergeometrica Una tienda de productos deportivos tiene en existencia N=20 pares de botas 
para esquiar de las cuales r = 8 son de su talla. Si usted selecciona n = 3 pares que usted desea, ^cual es la 
probabilidad de que x = 1 le quede bien? 

P(X = 1) = 

= sC| = 0.4632 

20.1 


3. Distribucion de Poisson El cable utilizado para asegurar las estructuras de los puentes tiene un promedio 
de 3 defectos por cada 100 yardas. Si usted necesita 50 yardas, <[,cu&l es la probabilidad de que haya una 
defectuosa? 


Debido a que la media estd dada en terminos de 100 yardas, se debe determinar que porcentaje de 100 yardas 
es 50: 50/100 = 0.50. Entonces, en numero promedio de defectos por 50 yardas es (3)(0.50) = 1.5. 

De la tabla D, P(X = 1 X I ji = 1 .5) = 0.3347, o utilizando la formula, 


P(x) = 


x\ 


1.5 1 

1 ! 


1.5’ - 


1! 


= 0.3347 


4. Distribucion exponencial Como gerente de Burguer Heaven, usted observa que los clientes entran a su 
establecimiento a raz6n de 8 por hora. ^Cual es la probabilidad de que pasen mas de 15 minutos entre la 
llegada de 2 clientes? 

Aunque la razon media esta dada originalmente como 8 por 60 minutos, se desea saber la probabilidad de que 
transcurran 15 minutos. Debe determinarse que porcentaje de 60 minutos es 15: 15/60 = 0.25. Asi, t es 0.25 y 
-pr = -8(.25) = -2. Para determinar P(X > 15), primero se debe hallarP(X< 15) y restar de 1.00. Si se tiene que 
jc = 0y (if = 2, latablaDmuestraqueP(X<15)= 1 -e 8(025) = 1 -e 2 =l -0.1353 = 0.8647. Entonces, P(X > 15) = 
1-0.8647 = 0.1353. 

Si se utiliza la formula (5.8) en lugar de la tabla, 

P(X < 15) = 1 - = 1 - e ' 8(025) = 1 - 0.1353 = 0.8647 

P(X > 15) = 1 - 0.8647 = 0.1353. 

Entonces, 


5. 


Distribucion uniforme Los tiempos de terminacion de un trabajo oscilan entre 10.2 minutos a 1 8.3 minutos 
y se piensa que est&n distribuidos uniformemente. ^,Cual es la probabilidad de que se requiera entre 12.7 y 14.5 
minutos para realizar este trabajo? 


P(X { ^ X as X 2 ) - 


(X 2 - X,) 
rango 


14.5 - 1 2.7 
8.1 ” 


= 0.2222 


6. Distribucion normal El Ministerio de Agricultura de Estados Unidos en un estudio sobre cultivos ha 
detectado que las precipitaciones diarias en ciertos lugares de Hawaii parecen estar distribuidas normalmente 
con una media de 2.2 pulgadas durante la estacidn lluviosa. Se determino que la desviacidn estdndar era de 
0.8 pulgadas. 


a . ^,Cual es la probabilidad de que llueva mas de 3.3 pulgadas en un dfa durante la estacion lluviosa? 


cr 0.8 

Como se ve en la gr^fica, un valor de Z de 1.38 da un area de 0.4162. Asx, P(X > 3.3) = 0.5000 - 0.4162 = 
0.0838. 
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7. Aproximacion normal a la distribucion binomial El 45 % de todos los empleados del centra de capacitacion 
gerencial en Condor Magnetics tienen titulos universitarios. ^Cual es la probabilidad de que de los 150 
empleados seleccionados aleatoriamente, 72 tengan tftulo universitario? 



La me dia y la desvia cion estandar son t± = (/i)(tt) = (150)(0.45) = 67.5 a = 

V(«)(7r)(l - it) = V ( 1 50)(0,45)(0.55) = 6.09. P{11.5 £ X s 72.5) se halla como 


Zt = 


72.5 - 67.5 
6.09 


0.82 


para un area de 0.2939 


Z 2 = 


71.5 - 67.5 
6.09 


= 0.66 


para un area de 0.2454 


/>(71.5 < X <s 72.5) = 0.2939 - 0.2454 = 0.0485 


Lista de formulas 


[5.1] 

fi = E(X) = 2[(*, )/*(*,)] 

Media o valor esperado de una 
distribucion discreta 

[52] 

a 2 = 2 [( jt , - fi) 2 P(x)} 

Varianza de una distribucidn de 
probabilidad 

[53] 

P(x) = n C x {irY - (1 - n)"-* 

Distribucion binomial 

[5.4] 

E{X) = fi = mt 

Media de una distribucion binomial 

[5.5] 

Ho 

II 

1 

Varianza de una distribucion 
binomial 
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[5.6] 

p(x) = ,Cx - "; r< 

[5.7] 

P { X )=£ f 

[5.8] 

1 

li 

'h 

VI 

[5.9] 

E{x) = fi = — 

[5.10] 

2 (b - a)- 
" * 12 

[5.11] 

Altura = — — 

b - i 

[5.12] 

P(X I < X < x 2 ) = ~ 

[5.13] 

1 b 
>< 

II 

N 


Rango 


Distribucion hipergeometrica 


Distribucion de Poisson 

Distribucion exponencial 

Valor esperado para una distribu- 
cion unifomie 

Varianza para una distribucion 
uniforme 

Altura de una distribucion 
uniforme 

Probabilidad de que un valor caiga 
dentro de un cierto rango en una 
distribucion uniforme 

Desviacion normal 


Ejercicios del capi'tulo 

39 . Una empresa de transportes por carretera descubre que el 30% de sus envios llega tarde. Si se programan 
ocho envios, cual es la probabilidad de que: 

a. ^Tres lleguen tarde? 

b. (Ttqs o mas lleguen tarde? 

c. ^Tres o menos lleguen tarde? 

d. ^Entre tres y cinco inclusive lleguen tarde? 

40 . Una encuesta revela que el 60% de los hogares prefiere cierta marca de ropa deportiva. Si se hizo la encuesta 
en 12 hogares, cu£l es la probabilidad de que esta ropa deportiva sea escogida por: 

a . ^Siete hogares? 

b . ^Menos de 6 hogares? 

c. ^Diez o mas hogares? 

d. ^Mas de 2 hogares? 

41 . Temps Ltda., despacho 9 trabajadores temporales diumos hacia el Bank of America de San Francisco. Solo 6 
de ellos estan realmente calificados para realizar el trabajo para el cual pueden ser asignados. El departamento 
de contabilidad selecciona aleatoriamente 5 de los 9 empleados. Cual es la probabilidad de que: 

a . ^Los 5 esten calificados? 
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b. ^Cuatro esten calificados? 

c. iPor lo menos 3 esten calificados? 

42 . La junta directiva de ABC, Inc. consta de 4 economistas, 3 contadores y 5 ingenieros. Si un comite de 7 
miembros debe seleccionarse aleatoriamente, ^cual es la probabilidad de que dicho comite este conformado 
por 2 economistas, 2 contadores y 3 ingenieros? 

43 . Los aviones llegan al aeropuerto O’Hare de Chicago a una razon promedio de 5.2 por minuto. Los controladores 
de trafico aereo pueden manejar de forma segura un maximo de 7 aviones por minuto. ^Cual es la probabilidad 
de que se arriesgue la seguridad del aeropuerto? Se cree que las llegadas tienen una distribucion de Poisson. 

44 . Business Week reporto que el 80% de la poblacion piensa que los salarios de los miembros del congreso son 
demasiado altos. Si 15 personas se seleccionan para conformar un comite para que decida por mayorfa de 
votos si tales salarios deben aumentarse o no, ^cual es la probabilidad de que el voto sea no aumentar tales 
salarios? 

45 . Los camiones began a cargar a una razon de 9.3 por hora en promedio. El encargado del puerto sabe que si 
began 6 o menos camiones, solo es necesario utilizar un puerto de carga. Si began mas de 6, debe abrirse un 
segundo puerto. ^Debe abrirse el segundo puerto? 

46 . Una compama que presenta un 10% de defectos en su produccion vende su producto en lotes de 15 unidades. 
Ofrece un descuento de US$100 si mas de 3 unidades salen defectuosas. ^Cuanto descuento deberfa esperar 
la compama por cada 50 envios? 

47 . Janet Powell es la contadora jefe de una gran tienda de ropa de un centro comercial. Ella hace la nomina para 
1 1 empleados, pero 7 contienen errores. Martha Holt, la jefe de Janet, no esta conforme con el trabajo de Janet 
y selecciona 5 registros de nomina para revisarlos. Se encuentra que 3 contienen errores. Janet se defiende 
diciendo que solo tuvo 3 errores en los 1 1 registros. ^Es este un buen argumento? 

48 . El tiempo promedio entre fallas del nuevo bombillo de General Electric es de 10 semanas. ^Cual es la probabilidad 
de que un bombillo falle dentro de 15 semanas? 

49 . Los clientes ingresan a un restaurante local a una razon de 10 por hora. ^Cual es la probabilidad de que 
transcurran 30 minutos entre las llegadas de 2 clientes cualquiera? 

50 . Los pesos contenidos en las cajas de cereal estan distribuidos de manera uniforme con una media de 35 onzas 
y un rango de 3.4 onzas. 

a. ^Cual es el peso minimo y maximo de las cajas? 

b. ^Cual es la probabilidad de que una sola caja contenga entre 32 y 33 onzas? 

51 . Durante los ultimos 20 anos Fred ha conducido todos los dias para ir a su trabajo. Lo mas rapido que ha hecho 
el viaje ha sido en 63 minutos. Lo maximo que se ha demorado ha sido 110 minutos. Si los tiempos de 
conduction estan distribuidos uniformemente: 

a. iCual es el tiempo promedio que Fred se toma? 

b . iCml es la probabilidad de que le tome 1.5 horas? 

52 . Los reportes muestran que se comenten 5 homicidios cada hora en las ciudades mas grandes de la nation, y 
que la distribucion se ajusta a una distribucion de Poisson. Si esto es cierto, ^cual es la probabilidad de que 
en los proximos 30 minutos, asesinen a tres personas? 

53 . Un proceso de manufactura produce 1 .2 defectos por cada 100 unidades de produccion, y sigue una distribucion 
de Poisson. ^Cual es la probabilidad de que las siguientes 500 unidades presenten 3 defectos? 
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54 . Normalmente se toma 2 semanas en entrenar a un trabajador para utilizar un taladro de banco. ^Cual es la 
probabilidad de que un trabajador pueda ser entrenado en 1.5 semanas? 

55 . En un esfuerzo por reducir costos, Wendy’s International Inc., un popular restaurante de comida rapida, 
analizo la tendencia para que sus procesadores automaticos determinaran los pesos de la hamburguesa, en 
las hamburguesas de cuarto de libra. Se encontro que los pesos oscilaban entre 3.2 onzas y 4.9 onzas. Se 
asumio una distribucion uniforme. ^Que porcentaje de hamburguesas tiene mas de un cuarto de libra? 

56 . ^La distribucion normal es una distribucion discreta o continua? Justifique su respuesta. Si 2 conjuntos de 
datos que estan distribuidos normalmente tienen la misma media pero diferentes desviaciones estandar, 
^como se compararfa el rango que comprende el 68.3% de todas las observaciones de un conjunto a otro? 
Haga las figuras necesarias para ilustrar como puede aplicarse la regia empfrica en ambas distribuciones. 

57 . Los costos de produccion mensual en una imprenta de Toledo son de $410 dolares en promedio, con una 
desviacion estandar de $87 dolares. El gerente promete al propietario de la tienda mantener los costos por 
debajo de $300 dolares este mes. ^Si los costos estan distribuidos normalmente, el propietario puede creerle 
al gerente? 

58 . Una empresa de contabilidad de Dooit and Quick descubre que el tiempo que se toma para realizar un proceso 
de auditorfa esta distribuido normalmente, con un tiempo promedio de 17.2 dfas y una desviacion estandar de 
3.7 dfas. El Sr. Dooit promete iniciar un trabajo de auditorfa para su firma dentro de 20 dfas, pero debe terminar 
una que ya ha comenzado. ^Que tan probable es que cumpla su promesa? 

59. Los corredores de una maraton local terminaron el trayecto en un tiempo promedio de 1 80.3 minutos; s = 25.7. 
^Que tan rapido deben correr para terminar dentro del primer 10%? 

60 . Los conectores electricos duran un promedio de 18.2 meses, y 5= 1.7. El vendedor acepta reemplazar uno si 
este falla dentro de los primeros 19 meses. De las 500 unidades, ^cuantas debe reemplazar en promedio? 

61 . Las ventas promedio de Barry son de US$500, con s = 15.2. Gana una comision de US$100 solo si sus ventas 
exceden de US$530. En promedio, ^cual es la comision por cada 25 ventas? 

62 . La produccion diaria en una planta local tiene un promedio de 7,300 toneladas, con s = 125 toneladas. En 
promedio, de 100 dfas, ^cuantas veces la produccion excedera de 7,000 toneladas? 

63 . Las boletas diarias en una de las atracciones de Dolly wood en Tenessee promedian US$1,012 con una 
desviacion estandar de US$3 12. ^Cual es la probabilidad de que la atraccion de hoy reciba mas de US$ 1 ,000? 

64 . Los estudiantes inscritos en la Prueba de Aptitud Gerencial para Graduados obtienen 812 en promedio, con 
una desviacion estandar de 145. Solo quienes estan entre el 20% de los mejores pueden aplicar a una beca 
especffica. Gus Genius recibio un puntaje de 900 en la prueba. ^Puede aplicar? 

65 . Las unidades de almacenamiento en Stor-N-Loc tienen un promedio de 82.3 pies cuadrados, con s = 53.7 pies 
cuadrados. ^Cuantos pies cuadrados debe tener una unidad para que sea mas grande que el 90% de todas las 
unidades? 

66. De acuerdo con la National Geographic , el 32% de los australianos que viven en el interior bebe “tinnies”, 
una clase de cerveza local. De los 500 australianos seleccionados aleatoriamente, ^cual es la probabilidad de 
que por lo menos 150 hay an bebido una tinnie? 

67 . El Chicago Tribune informo que el 69% de los rusos estaban peor economicamente despues de la revolution. 
De los 800 seleccionados aleatoriamente, «[c ual es la probabilidad de que menos de 580 experimenten condiciones 
mas duras? 

68. El Chicago Tribune informo que el 56% de los ninos que tienen 7 ahos cree que la Cenicienta era una persona 
real. ^Cual es la probabilidad de que por lo menos el 50% de 120 nihos de 7 anos crea lo mismo? 
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O PUESTA EN ESCENA 


Como respuesta a la solicitud del alcalde, como se establece 
en la seccion Escenario a comienzos de este capftulo, los 
investigadores tienen que determinar el tiempo promedio 
de respuesta y la variation de tales tiempos de respuesta. 
Tambien teman que calcular la probabilidad de que el tiempo 
de respuesta exceda (1) 1,5 minutos, (2) 2 minutos, y (3) 3 
minutos. 

El alcalde tambien estaba interesado en la probabilidad 
de que la ayuda de la policia estatal sea necesaria asi como 


la probabilidad de que transcurran 10 minutos y 1 5 minutos 
entre las llamadas. Los investigadores tambien teman que 
fijar el costo para cada hogar con un avaluo catastral superior 
a US$70,000 para lograr la meta de reduction del tiempo 
de respuesta promedio a 2 minutos. 

Prepare el informe que usted entregana de acuerdo con 
el formato establecido en el apendice I. Trate cada uno de 
estos puntos junto con otros que usted considere 
pertinentes. 


Del escenario a la vida real 

Los valores promedio de las viviendas son de gran importancia economica tanto para los consumidores individuals 
como para los gobiemos locales. El precio promedio de una casa de una familia es un indicador de cuanta casa 
puede adquirir un consumidor; es decir, el tiempo que tiene la casa de haber sido construida, los pies cuadrados 
que tiene, el numero de banos, de alcobas y asi sucesivamente. El Ministerio de Vivienda y Desarrollo Urbano de 
Estados Unidos (The U.S. Department of Housing and Urban Development) pone a disposicion casas de valor 
promedio a nivel nacional ( www.huduser.org ). En este sitio, haga clic en “publicaciones”, luego en “Mercado de 
Vivienda y demografia”. En la siguiente lista, haga clic en “Condiciones del Mercado de Vivienda en Estados 
Unidos , y luego haga clic en “Emision Actual”. En la seccion de Datos Historicos, las tablas 8A y 8B proporcionan 
los datos sobre precios para casas unifamiliares nuevas y existentes desde los anos 60 hasta la actualidad. Vale la 
pena destacar el precio promedio actual de cada tipo. 

La Asociacion Nacional de Agentes Inmobiliarios proporciona una seleccion de listados de casas para la 
venta en toda la nation (www.realtorads.com). Piense en tres areas del pai's en donde le gustana vivir. En este 
sitio, para cada una de sus tres areas deseadas utilice los precios promedios de vivienda nacional para ver la lista 
de casas disponibles. /, Es lo que usted desea? <',() preferina algo mas costoso o menos costoso? (i Hay diferencias 
importantes entre las tres areas en cuanto a la “cantidad de casa” que usted puede comprar al precio promedio? 

Note que las tasas hipotecarias determinan en parte el precio de la casa que usted puede adquirir. El Directorio 
de Credito Hipotecario (Mortgage Loan Directory) (www.mortgageloan.com) proporciona una seleccion de 
tasas hipotecarias actuales por estado. 







Plan del capi'tulo 

Este capitulo proporciona una introduccion al concepto de muestreo y a la forma como se utilizan las muestras 
para hacer inferencias sobre la poblacion. 
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E S C E N A R I 0 


Varios clientes adinerados lo han seleccionado como analista 
de inversiones para evaluar tres industrias ampliamente 
distintas. Su intencion es identificar en cual industria deben 
invertir. Actualmente estan considerando la industria 
deportiva y de esparcimiento, la cual parece estar gozando 
de prosperidad durante perfodos de recesion, debido a que 
la gente busca aliviar sus infortunios econdmicos. Los 
clientes anticipan un bajon en la econonua durante los anos 
venideros y por tanto sienten que los fondos invertidos en 
este sector podrian producir rendimientos significadvos. 

Debido al envejecimiento de la poblacion y a la necesidad 
cada vez mayor de asistencia medica, la industria de la 
asistencia medica es un segundo sector de interds para sus 
clientes. La amenaza al sistema nacional de seguridad social 
y la falla al instituir un plan nacional de asistencia medica 
tambien ha estimulado el interes de los clientes en este 
sector como una oportunidad potencial de inversion. Al 
invertir en este campo, los clientes esperan capitalizar sobre 
una tendencia demografica persistente y, al mismo tiempo, 
mitigar la creciente amenaza al bienestar de la poblacion de 
la tercera edad de la nacion. 

Finalmente, desean una evaluacion de un gran grupo de 
firmas que se concentra en la protection ambiental y en la 
preservacidn de los pantanos de la nacidn. Sienten que 
dicha inversion no solo generarfa recompensas fmancieras. 


sino que tambien proporcionaria una contribution 
importante para la posteridad para muchas generaciones 
del futuro. 



Su andlisis necesitara de la aplicacion de gran parte de la 
informacidn presentada en este capitulo sobre 
distribuciones muestrales y la probabilidad de carteras de 
inversion exitosas para estos clientes importantes. 


6.1 Introduction 

Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su totalidad. Es necesario 
seleccionar una muestra representativa de un tamano mds manejable. Esta muestra se utiliza luego para sacar 
conclusiones sobre la poblacidn. Por ejemplo, se puede calcular la media muestral, el estadfstico X, y utilizarlo 
como un estimado de la media poblacional fU. El estadfstico se utiliza como estimador del parametro. Al confiar en 
una muestra para sacar alguna conclusion o inferencia sobre la poblacion, se esta en la estadfstica inferencial. 

Estadi'stica inferencial La estadistica inferencial involucra el uso de un estadistico 
para sacar una conclusion o inferencia sobre el parametro correspondiente. 

El proceso inferencial es extremadamente importante en muchos analisis estadfsticos. En los capftulos 7 y 8 que 
tienen que ver con estimacion y prueba de hipotesis, la estadfstica inferencial es esencial. 
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Sin embargo, el valor estadistico depende de la muestra tomada. De cualquier poblacion dada de tamano N, es 
posible obtener muchas muestras diferentes de tamano n. Cada muestra puede tambien tener una media diferente. 
De hecho, es posible obtener una distribution completa de X's diferentes de varias muestras posibles. 


6.2 Distribuciones muestrales 

En un estudio de las 500 firmas que aparecen en la revista Fortune sobre los negocios mas grandes de la nation, 
se puede tomar una muestra de n = 50. De esta muestra se puede calcular la tasa de rendimiento promedio X para 
estas 50 firmas. Esta media muestral serviria entonces como un estimado de |i, la tasa promedio de rendimiento de 
la poblacion para todas las 500 firmas. 

De esta lista de 500 firmas, serfa posible obtener muchas muestras diferentes de tamano 50. Especificamente se 
podrfa obtener 500 C 50 muestras diferentes de tamano n = 50. Debido a que 5Q0 C 50 es un numero mas bien grande, se 
asume en aras de la simplicidad de la discusion, que se tiene una poblacion de N = 4 ingresos para cuatro 
estudiantes universitarios. Estos ingresos son de US$100, US$200, US$300 y US$400. El ingreso promedio puede 
calcularse como j u = US$250. Sin embargo, para hacer las cosas aun mas simples, se puede pensar que calcular la 
media de cuatro observaciones requiere mucho esfuerzo. Como altemativa, se decide seleccionar una muestra de 
n = 2 observaciones para estimar el fi “desconocido”. Se podrfa entonces seleccionar aleatoriamente una muestra 
de 4 C 2 = 6 posibles muestras. Estas seis muestras distintas y sus medias se muestran en la tabla 6.1 


Tabla 6.1 

Muestra 

Elementos muestrales X. 

Medias muestrales X 

Todas las 

1 

100,200 

150 

muestras posibles 

2 

100,300 

200 

de tamano n = 2 

3 

100,400 

250 

de una poblacion 

4 

200,300 

250 

de N = 4 ingresos 

5 

200,400 

300 


6 

300,400 

350 


Salvo las muestras tercera y cuarta, cada muestra tiene una media diferente. Asumiendo que cada muestra 
tiene la misma probabilidad de ser seleccionada, la probabilidad de seleccionar una muestra que de una X igual a 
la media poblacional de 250 es solo 2/6 = 33.3%. Cuatro de las seis muestras resultaran con algun error en el 
proceso de estimation. Este error de muestreo es la diferencia entre y la media muestral que se utiliza para 
estimarlo, {X- ju). 


Error de muestreo Es la diferencia entre el parametro poblacional y el estadistico de 
la muestra utilizado para estimar el parametro. 


Debido simplemente al azar se puede seleccionar una muestra den = 2 que conste de US$100 y de US$300. La 
media resultante de X = US$200 produce un error de muestreo de US$250 - US$200 = US$50. Por supuesto que 
nunca se puede calcular realmente el tamano del error de muestreo debido a que la media poblacional sigue siendo 
desconocida. Sin embargo, se debe ser consciente de que es probable que ocurra algun error de muestreo. 
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Con una poblacion de solo A' = 4. sc puede enumerar cada media muestral posible que aparece en la tabla 6.1 , 
junto con su respectiva probabilidad. Tal listado se le denomina una distribution muestral, y aparece en la tabla 
6.2 y como histograma en la figura 6. 1 . 


Tabla 6.2 

Distribucion 
muestral para 
muestras de tamano 
n = 2 en una 
poblacion 
de N = 4 ingresos 


Media muestral X 

Numero de muestras que danX 

Probabilidad de P(X) 

150 

1 

1/6 

200 

1 

1/6 

250 

2 

2/6 

300 

1 

1/6 

350 

1 

1/6 



1 


Figura 6.1 

Distribucion 
muestral para 
muestras 
de tamano n = 2 
en una poblacion 
de N = 4 ingresos 


WO 

2/6 

1/6 


150 200 250 300 350 



Distribucion muestral Es una lista de todos los valores posibles para un estadistico 
y la probabilidad relacionada con cada valor. 


A. La media de las medias muestrales 

Vale la pena notar que la distribucion muestral de las medias muestrales es simplemente una lista de todas las 
medias muestrales posibles. Estas medias muestrales, al igual que cualquier lista de numeros, tienen una media 
denominada “la media de las medias muestrales” o la gran media. Esta media de las medias se calcula de la forma 
usual: las observaciones individuales_(medias muestrales) se suman y el resultado se divide por el numero de 
observaciones (muestras). Se utilizaX(que se lee como X doble barra) como simbolo de la gran media. 





La media de las medias 
muestrales 

31 * 

II 

IIX 

[6.1] 


en donde K es el numero de muestras en la distribucion muestral. Debido a que hay 6 muestras en la presente 
distribucion muestral, se tiene que 


= 150 + 200 4- 250 + 250 + 300 + 350 ___ 

X — ~ ~~ 250 


6 
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Ademas debe notarse que la media de la distribucion muestral Xes igual a la media de la poblacion original 
= 250. Esto no es coincidencia. La media de la distribucion muestral siempre sera igual a la media poblacional (X 
= jU). No debe confundirse n , el numero de observaciones en una sola muestra, con K el mimero de muestras en la 
distribucion muestral. De la poblacion N= 4 en el caso actual, las muestras de tamano n-2 produjeron 4 C 2 = K = 
6 muestras diferentes en la distribucion muestral. 


B. La varianza y el error estandar de las medias muestrales 

La distribucion de las medias muestrales tambien tiene una varianza. La varianza en las medias muestrales es como 
cualquier otra varianza. Mide la dispersion de las observaciones individuates (medias muestrales) alrededor de su 
media (la gran media). Ademas, esta varianza se calcula al igual que cualquier otra varianza. Es la media del 
cuadrado de las desviaciones con respecto a su media. Se halla 

1. Determinando la cantidad por la cual cada una de las observaciones (medias muestrales) difiere de su media (la 
gran media). 

2. Elevando al cuadrado tales desviaciones. 

3. Promediando las desviaciones al cuadrado y dividiendo por el numero de medias muestrales, K. 

Asi, donde a 2 es la varianza de la distribucion de las medias muestrales, se tiene 

’ X 


Varianza de la distribucion muestral 2 _ S(x - X ) 2 _ S(x - /x) 2 

de las medias muestrales s ~ k ~ K 


[ 6 . 2 ] 


Dadas las seis medias muestrales anteriores, 

? = (!50 - 250) 2 + (200 - 2 50) 2 + (250 - 250) 2 + (250 - 250) 2 + (300 - 250) 2 + (350 + 250) 2 

ov - 6 

= 4,167 dolares al cuadrado 

Si se tuviera que sacar la raiz cuadrada de la varianza en la distribucion de estas medias muestrales, se tendrfa 

el error estandar de la distribucion muestral, cr r Por tanto, 


Error estandar de la distribucion 
muestral de las medias muestrales 




[6.3] 


En el caso actual 

cr x = V4, 1 67 

= 64.55 dolares 

El error estandar de la distribucion muestral (o error estandar) es una medida de la dispersion de las medias 
muestrales alrededor de fi. Es analogo con la desviacion estandar que se calculo en el capitulo 3, la cuaj_ media la 
dispersion de las observaciones individuates alrededor de su media. Debido a que la diferencia entre X y fA es el 
error de muestreo , toda medida de la tendencia de la media muestral a desviarse de fJ. se le denomina acertadamente 
error estandar . Por tanto, el error estandar cr x mide la tendencia a sufrir del error de muestreo en el esfuerzo por 
estimar jU. 
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Ejemplo 6.1 

Las ventas en miles de dolares para East Coast Manufacturing (ECM) durante lo ultimos 5 meses 
fueron de 68, 73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la poblacion. la media 
claramente es /I = 7 1 .6. Como director de marketing de ECM, se desea estimar este n “desconocido” 
tomando una muestra de tamano n = 3. Se espera que el error de muestreo que es probable que 
ocurra sea relativamente pequeno. Realice la distribucion muestra] y haga comentarios sobre el 
posible error de muestreo 


Solucion 


Hay 5 C 3 =10 muestras en la distribucion muestral: 


Numero 
de la muestra 

Elementos 
de la muestra X . 

Media 
muestral X 

Numero 
de la muestra 

Elementos 
de la muestra X j 

Media 

muestral X 

1 

68 , 73,65 

68.67 

6 

68 , 80,72 

73.33 

2 

68 , 73,80 

73.67 

7 

73 , 65,80 

72.67 

3 

68 , 73,72 

71.00 

8 

73 , 65,72 

70.00 

4 

68 , 65,80 

71.00 

9 

73 , 80,72 

75.00 

5 

68 , 65,72 

68.33 

10 

65 , 80,72 

72.33 


La distribucion muestral es: 


X 

PC?) 

68.67 

1/10 

73.67 

1/10 

71.00 

2/10 

68.33 

1/10 

73.33 

1/10 

72.67 

1/10 

70.00 

1/10 

75.00 

1/10 

72.33 

1/10 


La media de la distribucion muestral es 


X = 


68.67 + 73.67 + 71.00 + 71.00 + • • • + 72.33 
10 


= 71.6 = /x 


La varianza y el error estandar de la distribucion muestral son 


cr~ 


nx ~ m ) 2 

K 

(68.68 - 71.6) 2 + (73.67 - 71.6) 2 + - • • + (72.33 - 71.6) 2 

10 


— 4.31 miles de dolares al cuadrado 

= V'4.31 = 2.08 miles de dolares 



CAPITULO 6 • Distribuciones muestrales 149 


Interpretation 

La media de la distribucidn muestral es igual a la media de la poblacion original jj, = 7 1 .6. Hasta aqui 
no hay sorpresa alguna. El error estandar, el cual mide el grado de dispersion de las 10 medias 
muestrales alrededor de p, indica en cuanto puede variar la media muestral de la media poblacional. 
^Esto es lo que se tenia en mente cuando se esperaba un error de muestreo “relativamente pequeno?” 


Como se habra notado, la formula (6.2) requiere de mucha aritmetica de tercer grado para calcular la varianza de 
la distribuci6n muestral. Una aproximacion cercana puede obtenerse mediante 


Y 





CT 

X n 


[6.4] 


Claro que esto requiere la suposicion que la varianza poblacional o 2 sea conocida. 

La formula (6.4) es apropiada solo si el muestreo se realiza con reemplazo , o si la muestra se toma de una 
poblacion muy grande (virtualmente infinita). Si el muestreo se realiza sin reemplazo y si el tamano de la muestra 
es mas del 5% de la poblacion, n > 0.05 V, debe aplicarse el factor de correccion para poblaciones finitas (fpc). La 
formula apropiada para el error estandar entonces es 


Error estandar (T _ a [n - n 

utilizando el fpc ' ~ Vn \'<v - 1 


[6.5] 


en donde j™ n es el fpc. 

\n - 1 


Si n es pequeno respecto a N (menos del 5%), el fpc se aproxima a 1 y por tanto es innecesario, pues multiplicar 
por 1 no cambia el valor del error estandar. 


C. El impacto del tamano de la muestra en el error estandar 

Dada una poblacion de tamano N = 1000, se considera que ^se obtendrfa un estimado mas preciso de la media 
poblacional p con una muestra de tamano n = 100 o con una muestra de tamano mas grande de n = 900? 
Indiscutiblemente es probable un estimado mas exacto con una muestra mas grande. Esta suposicion se verifica 
examinando la formula (6.3). Puede verse que a medida que n aumenta, a x disminuye. El hecho de que las muestras 
mas grandes lleven a errores de muestreo mas pequenos se vuelve cada vez mas importante a medida que los 
autores progresan en el estudio de la estadfstica inferencial. 


Ejercicios de la seccion 


1. Defina los siguiente terminos en su propio lenguaje. De ejemplos de cada uno. 

a . Distribucion muestral. 

b . Media de las medias. 

c. Varianza y error estandar de la distribucion muestral. 
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2. Una poblacion de las producciones semanales de una fabrica en miles de toneladas es 200, 250, 150, 200 y 300. 
Realice una distribution muestral y calcule la media de las medias y el error estandar para las muestras de 
tamano n = 2. 

3. ^Que pasara con el error estandar del ejercicio anterior si n = 3? ^Por que hay diferencia? 

4 . Las muestras de n = 40 se toman de una poblacion grande con una media de 100 y una desviacion estandar 
de 25. Calcule e interprete el error estandar. 

5. Repita el ejercicio anterior con n = 100. Discuta la diferencia. 


6.3 Teorema del limite central 

De la diseusion que se ha realizado hasta el momento, es evidente que es posible tomar muchas muestras de un 
tamano dado de cualquier poblacion. Estas muestras dan pie a toda una distribucion de medias muestrales. Si la 
poblacion original esta distribuida normalmente, la distribucion de las medias muestrales tambien estara distribuida 
normalmente. Es decir, que todas las medias muestrales se graficaran como una distribucion normal. 

Esto se observa en la figura 6.2. La grafica superior muestra que la distribucion de las observaciones individuales 
X en la poblacion esta normalmente distribuida y centrada en una media de ji = 500 y una desviacion estandar 
< 7 = 50. Vale la pena notar que las observaciones individuales X estan medidas en el eje horizontal. 


Figura 6.2 

Distribucion 
de las medias 
muestrales 
de una poblacion 
normal 



La grafica inferior de la figura 6.2 muestra la distribucion de las medias muestrales que resultaran si se toman 
todas las muestras de tamano n ~ 25. Las medias muestrales X^ se miden en el eje horizontal. Estas medias 
muestrales tambien estan distribuidas normalmente y estan centradas en la media poblacional debido a que X = fi 
- 500. Es decir, la media de las medias muestrales es igual a la media de la poblacion. Ademas la dispersion de la 
poblacion original O- 50 es mayor que la dispersion de las medias muestrales cr x = cr/Vn = 50/V25 = 10. 
Las X. estan mas dispersas que las X debido a que = cr/Vn . 

Surge una pregunta respecto a como seria la distribucion de las medias muestrales si la poblacion original no 
esta distribuida normalmente. La respuesta la proporciona el Teorema del Limite Central. El teorema del limite 
central dice que para una poblacion cuaiquiera , a medida que n aumenta, la distribucion de las medias muestrales 
se aproxima a una distribucion normal con una media de X = jA y un error estandar de a x = cr/Vn . 
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. pgpitr ...' ; : 7 : — — — ; .... ■ ; ■■■■ 

p Teorema del limite central A medida que n se vuelve mas grande, la distribution de 
las medias muestrales se aproximara a una distribution normal con una media X= ^ y 
| un error estandar de - cr/Vn 

■ — . 

Portanto, incluso si la poblacion no esta distribuida normalmente, la distribucion de muestreo de las medias 
muestrales sera normal si n es lo suficientemente grande. La regia general es que si n es por lo menos 30, el teorema 
del limite central asegurara una distribucion normal en las medias muestrales incluso si la poblacion no es normal. 

Observando la figura 6.3 se asume que la poblacion en la grafica superior, la cual no esta distribuida normalmente, 
tiene una media de p = 1000 con una desviacion estandar de < 7 = 100. La grafica del centro muestra la distribucion 
de las medias muestrales que resultarfan si se tomaran las muestras de tamaiio n = 50. La distribucion de las medias 
muestrales esta normalmente distribuida y centrada en X - /j. = 1 000. Ademas, la dispersion de las medias muestrales, 
tal y como la mide el error estandar, es cr x = cr/Vn = 1 00/V50 = 1 4. 1 4. Vale la pena notar que las A estan 
menos dispersas que las observaciones individuales en la poblacion original: cr> cr/Vn . 


I Figura 6.3 

| Distribucion 
I de las medias 
I muestrales 
| de una poblacion 
no normal 


Moda 



La grafica inferior de la figura 6.3 ilustra lo que le sucede a la distribucion de X % a medida que el tamaiio de la 
muestra aumenta. Si el tamaiio de la muestra aumento a n = 100, el error estandar se vuelve a- = cr/Vn = 100 / vTOO 
= 10. Las medias muestrales estan compactadas mas estrechamente alrededor de la media poblacional (i = 1000. 
Como la mayorfa de las medias muestrales estan mas cerca de la media poblacional, el error estandar que se 
obtiene en el esfuerzo por estimar ji es menor. Por esto, es probable que las muestras mas grandes produzcan 
estimados mas precisos de la media poblacional. 
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Ejercicios de la seccion 


6. Explique el teorema del limite central en sus propias palabras. 

7. ^Que se entiende por desviacion estandar de la poblacion y por error estandar de la distribucion muestral de 
las medias muestrales? ^Como se relacionan y como se diferencian en cuanto a tamano? Dibuje las graficas en 
su respuesta. 

8. i,Que pasa con el error estandar a medida que el tamano de la muestra aumenta? Dibuje las graficas para 

ilustrar. 


6.4 Uso de la distribucion muestral 

La importancia de la discusion anterior puede reconocerse solo si se recuerda que muchas decisiones se toman 
con base en los resultados muestrales. Un gerente administrativo puede tomar una muestra de un producto para 
determinar si cumple con ciertas especificaciones de produccion. Un oficial del gobiemo tomara una muestra de 
los residentes para decidir si cierto plan tributario o programa de bienestar social producira los resultados deseados. 
Con frecuencia los academicos toman muestras de estudiantes para evaluar el impacto de los esfuerzos de 
instruccion. 

Generalmente, las muestras tienen un impacto muy directo y consecuencial en las decisiones que se tomen. 
Por tanto, toda conclusion que se saque o todo conocimiento que se tenga respecto a una muestra es muy 
importante. Una aplicacion muy comun y de gran utilidad en una distribucion muestral es la de determinar la 
probabilidad de que una media muestral clasifique dentro de un rango dado. Dado que la distribucion muestral 
estara distribuida normalmente pues (1 ) la muestra se toma de una poblacion normal, o (2) n > 30 y el teorema del 
limite central garantiza la normalidad en el proceso de muestreo, la desviacion normal puede utilizarse para ganar 
information esencial para el proceso de toma de decisiones. 

En el capitulo 5 se determino la probabilidad de seleccionar una observacion que estuviera dentro de un rango 
dado. Vale la pena recordar el ejemplo 5.7, cuando TelCom registro los mensajes telefonicos para sus clientes, los 
cuales promediaron 150 segundos, con una desviacion estandar de 15 segundos. TelCom deseaba determinar la 
probabilidad de que una sola llamada durara entre 125 y 150 segundos. Esto se hizo utilizando la formula de 
conversion, o la formula - Z, 



a 


en la cual X es una observacion unica de interes y a es la desviacion estandar poblacional. 

Sin embargo, muchas decisiones en los negocios dependen de una muestra completa, no solo de una 
observacion. En este caso, la formula de conversion debe alterarse para explicar el hecho en el cual se esta 
interesado, no solo en una observacion X sino en la media de varias observaciones X. Por tanto, cuando se hace 
el muestreo, la formula de conversion se vuelve 



[ 6 . 6 ] 




El valor de interes en el numerador no es una observacion unica X., sino la media de n observaciones. Ademas, 
el denominador no es la desviacion estandar poblacional o, sino el error estandar de la distribucion muestral G_. 
En lugar de determinar la probabilidad de la duration de una sola llamada, se puede calcular la probabilidad de que 
la media de n llamadas dure un cie^ * oerfodo de tiempo. 
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Por ejemplo, TelCom encuentra la probabilidad de que una sola llamada dure entre 150 y 155 segundos asi 
. X- ix 155 - 150 ^ _ 

2 _ = 7 - = 0.33 para un area de 0.1293 

cr 15 

Por tanto, P (150 < X < 155) = 0. 1293. Esto se muestra en la grafica superior de la figura 6.4. 


Figura 6.4 

Probabilidades 
para TelCom 



Se supone que TelCom desea ahora conocer la probabilidad de que la media de n = 50 llamadas este entre 150 
y 155 segundos. 


Z = 



155 - 150 
15 

V50 


2.36 


para un area de 0.4909 


Por tanto, P (150 < X < 155) = 0.4909. Esto se observa en la grafica inferior de la figura 6.4. La gran diferencia en las 
probabilidades se debe al hecho de que las medias muestrales estan menos dispersas que las observaciones 
individuales y a que las X estan mas compactas alrededor de ji = 150, como lo muestran las graficas. 

Muchas decisiones en los negocios dependen de los valores de las medidas estadisticas importantes. 
Considerando el ejemplo 6.2. 


Ejemplo 6.2 

TelCom planea instalar nuevos equipos que mejoranan la eficiencia de sus operaciones. Sin embargo, 
antes que los ejecutivos puedan decidir si dicha inversion sera eficaz en funcion de Jos costos, 
deben determinar la probabilidad de que la media de una muestra de n = 35 : 

a. Este entre 145 y 150. 

b . Sea mayor que 145. 

c. Seamenorque 155. 

d. Este entre 145 y 155. 

e. Sea mayor que 155. 
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Solucion 


a. P( 145 SX< 150) 



-L- 


- 1.97 


Z = 


!jl 145 - 150 


<Tf 15/V35 
P(145 150) =/ > (-1.97 <Z£0) 

= 0.4756 

b. P(X > 145) 


■1.97 o un area de 0.4756 



i i 

i i 


X - n 145 - 150 

2 = = — — — = — 1 .97 o un area de 0.4756 

<r f 2.54 

P(X > 145) = P(Z > -1.97) 

= 0.4756 + 0.5000 

= 0.9756 

c. P(X < 155) 
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P(X < 155) 


= P(Z< 1.97) 

= 0.4756 + 0.5000 
= 0.9756 


d. P(145<X< 155). Debe hallarse el area entre 145y 150, ysumarlaal area entre 150y 155. 



Z, = = — ~ 2 54~ ~ ° un area de 0.4756 

X - fji 155 - 150 , „„ 

Z 2 — = — — — = 1 .97 o un area de 0.4756 

2 o-j 2.54 

/ > (145 < X < 155) = P(— 1.97 < Z < 1.97) 

= 0.4756 + 0.4756 
= 0.9512 


e. P(X > 155) 



j i_ 

0 1.97 


X (segundos) 


Z 


„ X- ix 155 - 150 

Z = = — — — = 1 .97 o un area de 0.4756 

o-, 2.54 

P(X a 155) = P{Z > 1.97) 

= 0.5000 - 0.4756 

= 0.0244 


Interpretation 

Con base en esta information, TelCom puede tomar decisiones mas inteligentes respecto a la 
necesidad de nuevos equipos. 
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Si se puede predecir la probabilidad de que un cierto estadistico este dentro de un rango dado, la toma de 
decisiones se vuelve mas precisa y cientifica. Por ejemplo, es posible determinar la probabilidad de error considerando 
una poblacion con una media de ju — 25 y una desviacion estandar de d= 8.5. Como se muestra en la figura 6.5, si 
se toma una muestra de n = 50, se presentara un error de muestreo de 2 o mas si la media muestral es 27 o mas, o 
23 o menos. Por tanto, P (error) = p(X > 27) 4- P(X < 23). 

^ _ X ~ p 27~25 

^ — - — — 1.66 para un area de 0.45 15 

cr 8.5 

Vn V50 

P (X>27) = 0.5000 - 0.45 15 - 0.0485. Entonces el P (error > 2) = 0.0485 X 2 = 9.7 %. 

Existe casi un 10% de probabilidad de que el error de muestreo resultante de un intento por estimar q sea por lo 
menos dos. 


Figura 6.5 

La probabilidad 
de error 



Ejemplo 6.3 

The Paper House vende invitaciones, sorpresas y otros productos de papeleria para ocasiones 
festivas. Se asume que las horas semanales promedio que trabajan los empleados en la tienda es de 
p = 36.7, con una desviacion estandar de a= 3.5. Jill Ramsey, propietario de The Paper House, desea 
por lo menos un 90% de confiabilidad en que su estimado de las horas promedio trabajadas por 
empleado cada semana este dentro de 1 hora de la media poblacional real. Se selecciona una 
muestra de n = 36 semanas. ^Cual es la probabilidad de que Ramsey no este desilusionada con el 
estimado? 

Solucion 

Como se observa en la siguiente figura, P (error < 1) = P (35.7 < X< 37.7). 

7 37.7 - 36.7 

^ = — =1.71 para un area de 0.4564 

V55 

P(35.7 < X < 37.7) = 0.4564 X 2 = 91.28% 



35.7 


36.7 


37.7 


X 
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Interpretation 

Existe un 9 1 .28% de probabilidad de que el estimado de Ramsey este dentro de un error tolerable de 
1 hora. 


Ejercicios de la seccion 


9 . La poblacion de millas recorridas por camioneros de Over the Road Van Lines presenta una media de 8,500, 
con una desviacion estandar de 1,950. Si se toma una muestra de n = 100 conductores, cual es la probabilidad 
de que la media sea: 

a. ^Mayor que 8,900? 

b . ^Menor que 8,000? 

c. ^Entre 8,200 y 8,700? 

d. ^Entre 8, 1 00 y 8,400? 

10 . Las latas de gaseosa vendidas en Minute Mart tienen un promedio de 16.1 onzas, con una desviacion 
estandar de 1.2 onzas. Si se toma una muestra de n = 200, cual es la probabilidad de que la media sea: 

a. ^Menor que 16.27? 

b . ^Porlomenos 15.93? 

c. ^Entre 15.9 y 16.3? 

11 . Una encuesta realizada por la Asociacion Nacional de Education revelo que los estudiantes de ultimo aho de 
secundaria ven television un promedio de 37.2 horas por semana. Se asume una desviacion estandar de 5.4 
horas. En una muestra de n = 500 estudiantes, que tan probable es que la media muestral sea: 

a. <Mas de 38 horas? 

b. ^Menos de 36.6 horas? 

c. ^Entre 36.4 y 37.9 horas? 

12 . El consumo diario de agua en Dry Hole, Texas, promedia los 18.9 galones por hogar, con una desviacion 

estandar de 3.6 galones. El comisionado de la ciudad desea estimar esta media no conocida con una muestra 
de 100 hogares. ^Que tan probable es que el error de muestreo exceda los 0.5 galones? 


6.5 La distribution de las proporciones muestrales 

Aunque la discusion hasta ahora se ha concentrado exclusivamente en las medias, muchos asuntos de negocios 
tratan la proporcion de la poblacion 7t. Una firma de marketing puede querer averiguar si un cliente ( 1 ) compra o (2) 
no compra el producto. Un banco con frecuencia debe determinar si un depositante (1) pedira o (2) no pedira un 
credito para auto. Muchas firmas deben determinar la probabilidad de que un proyecto para presupuestar capital 
(1) generara o (2) no generara un rendimiento positivo. En estos casos se utiliza la proporcion muestral p para 
estimar el parametro desconocido K. 

El proceso de las proporciones muestrales es muy similar al de las medias. De cualquier poblacion es posible 
obtener muchas muestras diferentes de un tamano dado. Cada muestra tendra su propia proporcion de “exitos”, 
p. Sin embargo, al igual que con las medias, el valor esperado de la distribution muestral de las proporciones 
muestrales sera igual a la proporcion de exitos en la poblacion: E(p) = n. 

Lugget Furniture pregunta a toda la poblacion N = 4 clientes si vieron el anuncio publicitario de Lugget en el 
periodico de esta manana. Se registro una respuesta de “sf ’ como exito, y de “no” como fracaso. Los cuatro 
clientes respondieron S v N 2 , N 3 y S 4 . La proporcion poblacional de exitos es n - 0.50. Se tomaron muestras de 
tamano n = 2, y la proporcion de exitos se registra en la tabla 6.3. 
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Tabla 6.3 

Distribueion de las 
proporciones muestrales 


X. 

Numero de exitos 

p (proporcion de exitos) 

5„ W 2 

1 

0.50 

S, w 3 

1 

0.50 

5,S 4 

2 

1.00 

w 2 . n 3 

0 

0.00 

w 2 .s 4 

1 

0.50 

n 3 .s. 

1 

0.50 



3.00 


El valor esperado (media) de la distribueion muestral de la proporcion muestral es 


El valor esperado de la _ 5 £ 

distribueion muestral K 


[6.7] 


y el error estandar es 


/( tt)( 1 ~ ir) 

<T P = V 

[6.8] 

V n 



De la misma manera que con las medias, si n > 0.05 N, se requiere el fpc y el error estandar se vuelve 


/0r)(l - it) In — n 
cr„ = \ \ 

[6.9] 

p V n \N - 1 



En este caso con Lugget Furniture 


E(p) = ~ = ~ = 0.50 = rr 

A O 


y, utilizando el fpc 


(7r)(l - 7r) 



n 

1 


J(0.50)(l - 0.50) 



= 0.289 


Las herramientas recientemente desarrolladas para las proporciones muestrales permiten determinar las 
probabilidades que pueden ser muy utiles en la toma de decisiones importantes. Esto se logra aplicando la 
desviacion normal a la distribueion de proporciones muestrales: 


^ P ~ IT 


z - 

[6.10] 
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Ejemplo 6.4 

BelLabs adquiere componentes para sus telefonos celulares en lotes de 200 de una firma en Palo 
Alto. El componente tiene una tasa de defectos del 10%. Una polftica establecida recientemente por 
BelLabs establece que si el siguiente envio tiene: 

a. Mas del 12% de defectos, definitivamente buscara un nuevo proveedor. 

b. Entre el 10 y el 12% de defectos, considerara un nuevo proveedor. 

c. Entre el 5 y el 10% de defectos, definitivamente no conseguira un nuevo proveedor. 

d. Menos del 5% de defectos, incremental sus pedidos. 

^Cual decision es mas probable que tome BelLabs? 


Solucion 

Debido a que el tamano de la poblacion N no se suministra, se asume que BelLabs compra muchos 
componentes y el tamano de la muestra de n = 200 es menor que 0.05N y el fpc por tanto no se 
necesita. 


( 0,1) (0.9) 
200 


0.021 


a. P(p > 0.12): 



- 0.12 ~ 0.10 _ 

Z = — ~ j = 0.95 para un area de 0.3289 
Pip > 0.12): 0.5000 - 0.3289 = 0.1711 


b. De la parte a , P(0. 10 <p < 0. 12) = 0.3289. 

c. P (0.05 <p< 0.10): 


0.05 - 0.10 

2 = = "”2.38 para un area de 0.4913 

d . De la parte c y P(p< 0.05) = 0.0087. 

Interpretacion 

Como la parte c tiene la probabilidad mas alta, BelLabs se quedara con su proveedor actual. 
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Ejercicios de la seccion 


13 . Una encuesta de opinion a 1000 residentes de una ciudad grande investiga si se esta a favor de un alza de 
impuestos para pagar un nuevo estadio deportivo. Si mas del 85% apoya el impuesto se presentara un 
referendo en las siguientes elecciones en la ciudad. Si la proporcion poblacional de todos los residentes que 
estan a favor del impuesto es p = 0.82 o sea 82%, ^cual es la probabilidad de que se incluya en la siguiente 
votacion? 

14 . El 30% de todos los empleados tienen capacitacion avanzada. Si en una muestra de 500 empleados menos del 
27% estaba preparado de forma adecuada, todos los nuevos contratados necesitaran registrarse en un 
programa de capacitacion. ^Cual es la probabilidad de que se inicie el programa? 

15 . Con base en una muestra de 100 profesores, se realiza un estudio para analizar su preferencia sobre el 
programa de pensiones del Fondo Anual de Seguros - Fondo de Participation de Pensiones Universitarias 
( Insurance Annuity Fund-College Retirement Equity Fund) (TIAA-CREF) de los profesores que esta a su 
disposition. Si menos del 60% esta satisfecho con el TIAA-CREF, se encontrara una altemativa. Asumiendo 
n = 65%, ^cual es la probabilidad de que sea complementado el plan actual? 

16 . La proporcion de todos los clientes de Pizza Hut que comen en el sitio es del 75%. En una muestra de 100 
clientes, ^cual es la probabilidad de que menos del 20% lleven su comida a casa? 

17 . El 60% de las reses de una manada grande tiene antrax. De las 100 reses seleccionadas aleatoriamente ^cual 
es la probabilidad de que por lo menos 50 tengan que ser apartadas de la manada? 


6.6 Metodos de muestreo 

En repetidas ocasiones se ha enfatizado la necesidad de seleccionar una muestra representativa de la poblacion. 
Una muestra que tergi verse la poblacion presentara un error de muestreo y producira estimados imprecisos de los 
parametros de la poblacion. 

Hay dos fuentes basicas de error de muestreo. La primera es sencillamente mala suerte. Debido a la “cuestion 
suerte”, la muestra puede contener elementos que no sean caracterfsticos de la poblacion. El destino puede dictar 
que ciertas selecciones en la muestra sean atipicamente mas grandes que la mayorfa de los de la poblacion y en tal 
caso resultarfa una sobreestimacion del parametro. O quizas muchos de los elementos muestrales tienden a ser 
mas pequenos de lo que tipicamente se encuentra en la poblacion y en tal caso resultana una subestimacion. 

Una segunda fuente de error de muestreo es el sesgo muestral. El sesgo resulta de la tendencia a favorecer la 
selection de ciertas muestras sobre otras en la recoleccion de los datos de la muestra. Un ejemplo clasico del 
sesgo muestral ocurrio en las elecciones presidenciales de 1936. Franklin D. Roosevelt era el candidato democrata 
contra Alf Landon, el candidato republicano. Una encuesta de los votantes realizada por Literary Digest (la cual 
hace mucho tiempo dejo de publicarse) revelo que Landon ganarfa de manera arrolladora. Cuando paso la humareda, 
despues de las elecciones, los editores de Literary Digest intentaron determinar realmente ipor que pudieron 
estar tan equivocados! 

Pronto descubrieron su equivocation. A1 seleccionar gente para la muestra tomaron nombres de dos fuentes: 
el directorio telefonico y el propio registro electoral. Vale la pena recordar que en 1936 la nacion se encontraba en 
medio de la Gran Depresion. La mayorfa de las personas culpaba, acertada o equivocadamente, a los republicanos 
por su catastrofe economica y se rehusaron a votar por cualquiera que tuviera afiliacion con ese partido. Literary 
Digest escogio personas que estaban siendo menos afectadas por las duras condiciones financieras y que 
podian adquirir un telefono y una suscripcion regular a la revista. Por tanto, las personas utilizadas en la encuesta 
no eran representativas de la nacion como un todo. La muestra tendia a favorecer en su election a los votantes 
que no estaban en contra de los republicanos de manera categorica. No es de sorprender entonces que la revista 
ya no este en circulation. 
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Existen muchos otros ejemplos en los cuales la seleccion de la muestra puede terminar en error. Por tan to, es 
sabio garantizar que la recoleccion de los datos de la muestra siga un metodo que haya comprobado su capacidad 
para minimizar dicho error. Aunque un examen exhaustivo de los metodos de muestreo esta mas alia del alcance de 
este texto, se sugiere un breve vistazo a los procedimientos de muestreo en este punto. 


A. Muestreo aleatorio simple 

Como se ha visto, pueden seleccionarse diferentes muestras de cualquier poblacion. Tomar una muestra aleatoria 
simple garantiza que cada muestra de algun tamano dado tenga la misma probabilidad de ser seleccionada. Se 
asume que una cadena nacional de comidas rapidas desea seleccionar aleatoriamente 5 de los 50 estados para 
tomar muestras sobre el gusto de los consumidores. Una muestra aleatoria simple garantizara que las 5Q C S = 
2,1 18,760 muestras de tamano, 5 tengan la misma probabilidad de ser utilizadas en el estudio. 

Una muestra aleatoria simple puede obtenerse simplemente enumerando las observaciones sobre pedazos 
identicos de papel, colocandolos en un sombrero y sacando el numero deseado. Ademas, tambien puede utilizarse 
una tabla de numeros aleatorios. La tabla con frecuencia es generada por un computador en la cual cada uno de 
los 10 dfgitos (0-9) tiene una probabilidad igual de ser seleccionado. Si se desea una tabla de tres digitos, el 
computador puede seleccionar 4, 2, 7, 5, 2, 6, 1 , 0, 5, y asi sucesivamente, formando los numeros aleatorios 427, 526, 
y 105. Una tabla de numeros aleatorios se proporciona en la tabla A. 

6. Muestreo sistematico 

Una muestra sistematica se forma seleccionando cada /esimo item de la poblacion. Si se determina que i es igual 
a 10, una muestra sistematica consta de cada decima observacion en la poblacion. La poblacion debe ordenarse 
o enumerarse en forma aleatoria. 

La primera seleccion debe determinarse aleatoriamente, y si i = 10, entonces estara en alguna de las primeras 
10 observaciones. El punto inicial exacto puede identificarse bien sea seleccionando un numero entre 1 y 10 
sacado de un sombrero, o utilizando una tabla de numeros aleatorios. En cualquiera de los casos se selecciona de 
allf en adelante cada decima observacion. 

El proceso de muestreo sistematico es ventajoso porque no requiere de un experto altamente calificado para 
contar hasta 10 y registrar el resultado. Ademas, el metodo permite flexibilidad ya que puede establecerse que i 
sea 10, 100, 1,000 o cualquier otro numero deseado. La determination del valor apropiado para i tambien es muy 
facil. Si se desea seleccionar una muestra de tamano 100 de una poblacion de 1,000, i debe ser 10. 

El peligro principal que debe evitarse es la ocurrencia de un patron en el ordenamiento de la poblacion. Por 
ejemplo, enumerar la poblacion alfabeticamente asume una distribution aleatoria por todo el alfabeto. 


C. Muestreo estratificado 

Recientemente, el Ministerio de Agricultura de los Estados Unidos se intereso en el impacto de las condiciones 
de sequia sobre la produccion de trigo. Especial preocupacion causo la tasa de bancarrota que hacia que los 
granjeros perdieran su tierra. Se sentia que un conteo de los niveles de produccion por parte de los agricultores 
de Kansas, Oklahoma, Nebraska y Dakota del Sur, los cuatro estados golpeados mas duramente por la sequia, 
podrfan probar que son utiles en el diseno de un programa de alivio. El ministerio decidio que deberfa tomarse una 
muestra de la cosecha de este ano por varios cientos de agricultores de cada estado. 

Sin embargo, se noto que el numero de agricultores era muy diferente en cada estado. Si se tomaba una 
muestra aleatoria simple de los cuatro estados como un todo, podrfa incluir proporcionalmente pocos agricultores 
de algunos estados y demasiados de otros estados. Esto resultarfa en una muestra no representativa, lo cual 
incrementaria el error de muestreo. 
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El Ministerio de Agricultura decidio tomar una muestra estratificada dividiendo a todos los agricultores en 
subgrupos o estratos (de ahi el termino muestreo estratificado ). En este caso, los subgrupos logicos serfan los 
cuatro estados en mention. La proportion de agricultores incluidos en la muestra de cada estado seria igual a las 
proporciones de todos los agricultores en cada estado: si los agricultores de Kansas constituian el 30% de todos 
los agricultores de todos los cuatro estados, entonces un 30% de los agricultores de la muestra serian seleccionados 
aleatoriamente de Kansas. 

Se toma una muestra estratificada forzando las proporciones de la muestra de cada estrato para que este 
conforme al patron poblacional. Se emplea comunmente cuando la poblacion es heterogenea, o disimil, aunque 
ciertos subgrupos homogeneos puedan aislarse. De esta forma el investigador puede incrementar la precision 
mas alia de la obtenida por una muestra aleatoria simple de tamano similar. 


D. Muestreo por conglomerados 

El muestreo por conglomerados, otra tecnica altemativa, ofrece ciertas ventajas sobre otros metodos. Consiste 
en dividir toda la poblacion en conglomerados, o grupos, y luego seleccionar una muestra de estos conglomerados. 
Todas las observaciones en estos conglomerados seleccionados estan incluidas en la muestra. Para ilustrar, se 
considera el siguiente ejemplo. El Ministerio de Agricultura de los Estados Unidos, en su estudio sobre las 
condiciones de sequia, puede decidir que una muestra por conglomerados es preferible. Una muestra por 
conglomerados se toma identificando los condados en cada estado como conglomerados. Una muestra de estos 
condados (conglomerados) se selecciona luego aleatoriamente utilizando una tabla de numeros aleatorios o 
algun otro medio generalmente aceptado. Todos los agricultores seleccionados de esta manera en los condados 
estan incluidos en la muestra. Este procedimiento con frecuencia es mas facil y rapido que el muestreo aleatorio 
simple o el estratificado. Por ejemplo, si es necesario viajar a cada finca de la muestra para observar los efectos de 
la sequia, es mas facil visitar varios agricultores en el mismo condado. 

Tambien es posible combinar el muestreo estratificado con el muestreo por conglomerados. En el ejemplo 
sobre agricultura, puede ser sabio seleccionar la muestra de un numero de condados de cada estado, proporcional 
al numero total de condados en los cuatro estados. 

Ciertos problemas pueden surgir en el uso del muestro por conglomerados. Si un porcentaje anormalmente 
grande (o pequeno) de agricultores en un conglomerado seleccionado tiende a utilizar la irrigation para mejorar la 
production del cultivo, los resultados de la muestra pueden estar sesgados. 

Esta discusion de ninguna manera explica los metodos de muestreo o los problemas que pueden surgir en el 
proceso de busqueda de una muestra representativa a ser utilizada para sacar inferencias estadisticas. Un estudio 
sobre las tecnicas de muestreo constituye todo un curso por si mismo y va mas alia del alcance de este texto. No 
obstante, debido a la importancia del proceso de muestreo, incluso el estudiante principiante deberia ser consciente 
de los fundamentos sobre muestreo. 


Problemas resueltos 

1. Los registros de inversiones muestran que la tasa promedio de rendimiento para las firmas que estan en la 
industria de bienes de consumo es del 30%, con una desviacion estandar del 12%. Si se selecciona una 
muestra de 250 de tales firmas, ^cual es la probabilidad de que la media de estas firmas exceda el 31%? 

Como lo muestra la grafica, la probabilidad de que la media muestral este entre el 30 y el 31% es 


V250 


para un area de 0.4066 
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Por tanto, P ( X> 0.3 1) = 0.5000 - 0.4066 = 0.0934 

2. Solo el 22% de todas las firmas en la industria de bienes de consumo comercializa sus productos directamente 
con el consumidor final. Si una muestra de 250 firmas revela una proportion de mas del 20% que se compromete 
en el mercadeo directo, usted planea hacer su siguiente compra a las firmas de esta industria. ^Que tan 
probable es que usted gaste su dinero bien ganado en otra parte? 

0 20 — 0 22 

Z - r = “0.76 para un area de 0.2764 

/ (0.22X0.78 ) 

\ 250 



Por tanto, P(p> 0.20) = 0.7765, y la probabilidad de que usted no compre a estas firmas es de 1 .00 - 0.7765 = 
0.2236. 


Lista de formulas 


[6.1] 

= IX 

X ~ K 

Media de las medias muestrales 

[6.2] 

2 2(X-IX) 2 

^ = K 

Varianza de la distribucion de las 
medias muestrales 

[6.3] 

cr, = 

Error estandar de la distribucion de 
las medias muestrales 

[6.4] 

O’ 

a *~Vn 

Error estandar de la distribucion 
muestral 

[6.5] 

o IN - n 

a *~ VniN-l 

Error estandar con el factor de 
correccion para poblaciones finitas 
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[6.6] 

2 = *^ 


Desviacion normal para medias 

[6.7] 

in 

ii 


Valor esperado de las proporciones 

[6-8] 

M(i - 

rr) 

Error estandar de las proporciones 

a »~y n 



[6-9] 

lM( 1 - tt) 

a r = t~ n 1 

1 1 
»— a 

Error estandar con el factor de 
correccion para poblaciones finitas 

[6.10] 

2 = ^ 


Desviacion normal para las 
proporciones 


Ejercicios del capitulo 

18 . Si se toma una muestra en la cual n < 30, <,que problema podriamos tener al trabajar con ella? 

19 . Si se toman varias muestras de un tamano dado en una poblacion, <,que influira en la variabilidad de las medias 
muestrales? iQu€ le pasa a dicha variabilidad a medida que n aumenta? 

20. De una sola poblacion se forman dos distribuciones de muestreo tomando todas las posibles muestras de un 
tamano dado para obtener una distribucion muestral A, y todas las muestras posibles de un tamano diferente 
para obtener una distribucion muestral B. Tales distribuciones se representan graficamente a continuation. 
^Cual distribucion contiene el tamano de muestra mas grande? ^Como puede explicarlo? 




21. Una poblacion de las ventas semanales (en miles de dolares) en Blazing Salads, un restaurante vegetariano en 
Chicago, es 27, 32, 17, 21 y 32. 

a. Calcule e interprete a. 

b. Determine n = 2 y desarrolle la distribucion muestral. 

c. Calcule e interprete y como se relaciona con a? 

d. Calcule e interprete |i. 

e. Calcule e interprete X. ^Como se compara con jli? 

22. Utilizando los datos del ejercicio 21, determine n = 3 y 

a. desarrolle la distribucion muestral. 

b. Calcule Xy g_ . ^Como difieren de los valores del ejercicio 21 y por que? 

23. Se toma una muestra de n = 50 de una poblacion grande, con una media de 12.2 y una desviacion estandar de 
4.1 ^Cuales son la media y el error estandar de la distribucion muestral de las medias muestrales? 



CAPITULO 6 • Distribuciones muestrales 105 


24 . Los clientes de Madison Hair Garden, una saia de belieza en Madison, Connecticut, son un promedio de 40.7 
personas por dia, con una desviacion estandar de 12.9. Si se toma una muestra de 100 dias, ^cual es la 
probabilidad de que el numero promedio de clientes exceda de 43? 

25 . Jim Sears fabrica equipos para agricultura. Su trabajo requiere del uso de barras de acero que deben tener una 
longitud promedio de por lo menos 50 pulgadas. Las barras pueden comprarse a un distributor en Kansas 
City cuyas barras miden en promedio 47 pulgadas solamente, con una desviacion estandar de 12 pulgadas, o 
de un proveedor en Dallas cuyas barras miden en promedio 49 pulgadas, con una desviacion estandar de 3.6 
pulgadas. Si Sears debe comprar 81 barras, ^deberia utilizar el proveedor en Kansas City o el de Dallas? 

26 . Segun la revista Business Week , el promedio de los anos de experiencfia de los pilotos de aerolinea es de 25.2. 
Se asume una desviacion estandar de 12 anos. Este ano usted debe tomar 36 vuelos comerciales. Usted 
espera que la experiencia promedio de los pilotos de los vuelos que usted tome sea superior a 30. ^Que tan 
probable es que X > 30? 

27 . Los depositos promedio en el First of America Bank en Peoria equivalen a US$7,012, con una desviacion 
estandar de US$532 y estan distribuidos normalmente. 

a. Si se selecciona un deposito aleatoriamente, ^cual es la probabilidad de que exceda de US$6,91 1 ? 

b. Si se selecciona aleatoriamente una muestra de n = 35 depositos, i cual es la probabilidad de que la media 
exceda de US$6,91 1 ? 

c. ^Por que al tomar una muestra se reduce su respuesta? Dibuje graficas, una encima de la otra para ilustrarlo. 

28. En promedio, el nivel de produccion en una planta de manufactura local es de 47.3 unidades por dia, con una 
desviacion estandar de 1 2.7. El gerente de planta tomara una muestra de 100 dias. Si la media muestral excede 
de 49, promete dar a todos los empleados una bonification de Navidad. ^Que tan probable es que los 
empleados disfruten de una feliz navidad? 

29. Los ingresos para los trabajadores de la linea de produccion en Chicago tienen un promedio de US$2 1. 1 5 por 
hora con una desviacion estandar de US$5.15. Estos ingresos estan sesgados a la izquierda. Describa la 
distribucion muestral de los ingresos para el tamaho muestral de 100. Dibuje las distribuciones, tanto para la 
distribucion original como para la distribucion muestral. 

30. Si el tamano de la muestra del ejercicio 29 fuera 64, en que se diferenciarfa la distribucion muestral? Grafique 
ambas. 

31 . Un mecanico local en promedio cobra US$110 por hacer una reparation determinada. Los registros muestran 
una desviacion estandar de US$21.50 en cobros. Un cliente se quejo recientemente porque su factura de 
US$115.50 era excesiva. Despues de un regateo considerable, el mecanico acepto reembolsar el dinero si la 
muestra de 36 trabajos similares revelaban tener una facturacion promedio menor que la del cliente. ^Piensa 
usted que el mecanico fue sabio al ofrecer esta negotiation? 

32 . Un proceso de manufactura produce unidades que miden en promedio 1 0 pulgadas de largo con una desviacion 
estandar de 3.2 pulgadas. Si solo pueden utilizarse las unidades que esten entre 9.5 y 10.5 pulgadas, ^cuantas 
pueden descartarse de una muestra de 100? 

33 . En la clase de computadores que se da a los estudiantes de estadfstica de segundo nivel, los estudiantes 
tuvieron un promedio de 14.2 errores con una desviacion estandar de 4.3 

a. iC ual es la probabilidad de que usted (o cualquier estudiante dado) tenga mas de 13 errores en el curso si 
se sabe que los errores estan distribuidos normalmente? 

b . Si los errores no estan distribuidos normalmente, ^cual es la probabilidad de que una muestra de 36 
estudiantes tenga un promedio superior a 13 errores? 

c. ^Por que sus respuestas son diferentes? Dibuje las dos graficas, una encima de la otra para ilustrar. 

d . ^Por que se necesito la suposicion de normalidad en la parte a y no en la parte bl 
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34 . La desviacion estandar en cuanto a la cantidad de tiempo que se gasta en entrenar a un trabajador para 
realizar un trabajo es de 40 minutos. Se toma una muestra aleatoria de 64 trabajadores. 

a. ^Cual es la probabilidad de que la media muestral exceda la media poblacional en mas de 5 minutos? 

b. ^Cual es la probabilidad de que la media muestral sea al menos mayor que la media poblacional en 8 
minutos? 

35 . Se tomo una muestra aleatoria de 81 compras en una tienda local por departamentos para estimar la media de 
todas las compras. Se sabe que la desviacion estandar poblacional es US$25. 

a. i Cual es la probabilidad de que la media muestral no sobrepase la media poblacional en mas de US$4? 

b. ^Cual es la probabilidad de que la media muestral subestime la media poblacional en menos de US$1? 

36. El promedio del fondo de pensiones en TIAA, para una poblacion de profesores, es de US$40,715, con una 
desviacion estandar de US$19,015. Halle la probabilidad de que una muestra de 75 profesores produzca un 
error de muestreo menor que US$ 1 ,000. 

37 . Las cifras nacionales muestran que el 32% de todos los estudiantes pierde su primer examen de estadfstica. 
Si se seleccionan aleatoriamente 100 estudiantes, ^cual es la probabilidad de que mas de 40 lo pierdan? 

38. Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100 unidades. ^Cual es la 
probabilidad de que menos del 10% scan defectuosas? 

39 . Del mismo proceso industrial mencionado en el ejercicio anterior, de nuevo usted compra 100 unidades. ^Cual 
es la probabilidad de que menos del 10% sean defectuosas? 

40 . Un productor de camaras de video publica que el 28% de las camaras de video vendidas en el mercado son de 
su marca. De las 150 ventas recientes, exactamente 40 fueron producidas por esta compama. ^Que piensa de 
lo que dice la compama? 

41 . Sus clientes requieren que por lo menos el 90% de sus productos no tenga defectos. Una muestra de 500 
revela que 31 tiene defectos. ^Cumple usted con las especificaciones de sus clientes? 

42 . El fabricante de un nuevo computador le comprueba que usted experimentara con su nuevo modelo solo un 
9% de reduction de tiempo en reparaciones y mantenimiento. Una revision de su equipo actual revela que en 
las ultimas 90 horas, 12 horas fueron de inactividad. ^E1 nuevo computador es mas confiable que el modelo 
actual? 

43 . Hay cinco cartas boca abajo sobre la mesa. Su amigo dice que posee percepcion extrasensorial. Usted 
selecciona una carta aleatoriamente sin revelar su escogencia a su amigo. De 200 intentos, el identifica 
correctamente 54 cartas. ^Usted cree que su amigo tiene tal percepcion extrasensorial? 

44 . Una corporation va a hacer una nueva emision de acciones. La ley exige que a los accionistas actuales se les 
debe dar la primera option de compra de toda nueva emision. La gerencia considera que el 45% de los 
accionistas actuales desearan comprar. Se selecciona una muestra aleatoria de 130 accionistas, 63 de los 
cuales expresan su deseo de comprar. 

a. <-,Cual es el error estandar de la*proporcion muestral? 

b. ^Cual es la media de la distribution de las proporciones muestrales? 

c. ^Cual es la probabilidad de obtener los resultados descritos en el problema si 7t = 0.45? 

45 . Sears ha determinado que el 17% de todas las compras hechas durante la epoca de navidad son devueltas. 
Si la tienda vende 150 video juegos, ^cual es la probabilidad de que maximo el 20% sea devuelto? 

46 . Sin elaborar el problema, explique que pasarfa a la respuesta del problema anterior si n se aumentara a 200. 
^Por que? 



CAP1TU LO 6 • Distribuciones muestrales 167 


Ej PUESTA EN ESCENA 

■ flSS wJL 


En la section Escenario, a comienzos de este capitulo, usted 
tenfa la responsabilidad de analizar tres industrias para 
identificar en cual debfan invertir sus fondos varios de sus 
clientes importantes. Los tres sectores en los cuales estdn 
interesados sus clientes son el sector deportivo y de 
esparcimiento, el campo de la asistencia medica y el de 
protection ambiental. Se supone que las tasas de rendimiento 
proraedio son del 8%, el 23% y el 15% respectivamente, y 
que la desviacidn estdndar en estos rendimientos son del 
3%, el 5% y el 7%. Las tasas de bancarrota son del 12%, el 
7.5% y el 3% en las tres industrias respectivamente. 

Los clientes estan preocupados por la tasa promedio de 
rendimiento que su inversion tendra, asi como por el riesgo 


de incumplimiento que tendran que soportar debido a la 
bancarrota. Su andlisis debe incluir sus estimados de las 
probabilidades dd incumplimiento y las tasas potenciales 
de rendimiento. Sus clientes son inversionistas muy 
cuidadosos y estan solicitando estimados de laprobabilidad 
de algun error en su analisis. Usted planea tomar muestras 
de 50 firmas de la industria deportiva, 150 firmas de la 
industria de asistencia mddica, y 250 firmas relacionadas 
con el manejo de la vida salvaje. Explique de forma completa 
y justifique toda suposicion adicional que deba hacer para 
completar el analisis. Prepare su informe final de acuerdo 
con las reglas establecidas en el apendice I sobre elaboration 
de reportes. 


Del escenario a la vida real 

Como inversionista individual, usted puede aprender mucho sobre compamas especificas en internet. Si usted 
esta considerando compamas sobre las que usted ha escuchado, un buen sitio para comenzar su busqueda de 
informacion es en los sitios web de las compamas. Los Marriott Hotels ( www.marriott.com ) es una empresa 
importante en la industria de esparcimiento. ^Que informacion proporciona su sitio web sobre los servicios al 
cliente? ^Que informacion sobre inversionistas se suministra en este sitio? De igual forma Aetna 
(www.aetnaushc.com) es un proveedor de asistencia medica importante. ^Que informacion se pone a disposicion 
de sus clientes en este sitio? sus inversionistas? Finalmente, Environment One Corporation (www.eone.com) 
fabrica un equipo de control de contaminacion. ^Que informacion pone a disposicion de los clientes esta compama? 
iA inversionistas? 

Usted puede buscar datos financieros de corporaciones especificas en la base de datos Edgar de la Comision 
de Bolsas y Valores (www.sec.gov). 







Plan del capitulo 


El capitulo 6 moslro c6mo las distribuciones muestrales de la media y de la proportion muestral pueden utilizarse 
para generar estimaciones puntuales de fx y n. Este capitulo muestra como pueden establecerse estimaciones por 
intervalo para estos dos parametros y como pueden asignarse los niveles de confianza a estos intervalos. 
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E S C E N A R I 0 

/ 


En 1997 la Agenda Federal de Investigacidn ( Federal 
Bureau of Investigation-FBY) implanto procedimientos 
revolucionarios para facilitar la captjjra de personas 
solicitadas por crfmenes graves. Un vocfeo de la Division 
de Estadisticas Criminales del FBI aparecio en el programa 
en vivo Larry King Live , en la Red de Noticias por Cable 
(Cable News Network, CNN) para discutir los 
procedimientos que harian mas seguras las calles de la 
ciudad. Ella menciono varias estadisticas que el FBI habia 
recolectado describiendo motivqs, tecnicas y frecuencia de 
los crfmenes que ella consideraba que eran utiles para hacer 
el perfil de criminales que andan sueltos y que la agenda 
desea capturar. 


Su discusion se centra en los esfuerzos de la agenda por 
mantener una gran base de datos sobre estadisticas 
criminales que pudieran utilizarse para predecir la actividad 
criminal y asf poder anticipar donde y cuando puede ocurrir 
un acto ilegal. Ella menciono varios casos que se habfan 
resuelto, en gran parte gracias al trabajo realizado por 
estadfsticos profesionales que proporcionaron estimaciones 
sobre tasas de reincidencia de los infractores , as/ como 
otras actividades que proporcionan alguna pista que ayude 
a su arresto. Esta informacion mostro ser de extrema utilidad 
para los agentes que trabajaban en el area y cuya funcion 
es ubicar a quienes estan en la lista de los mas buscados 
por el FBI. 



7.1 Introduction 

Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy grandes como para ser 
estudiadas en su totalidad. Su tamano requiere que se seleccionen muestras, las cuales se pueden utilizar mas 
tarde para hacer inferencias sobre las poblaciones. Si un gerente de una tienda minorista desea saber sobre el 
gasto promedio de sus clientes durante el ano anterior, podrfa encontrar diffcil calcular el promedio de los cientos 
o quiza miles de clientes que pasaron por su tienda. Sena mucho mas facil estimar la media poblacional con la 
media de una muestra representativa. 

Hay por lo menos dos tipos de estimadores que se utilizan mas comunmente para este proposito: un estimador 
puntual y un estimador por intervalo. Un estimador puntual utiliza un estadfstico para estimar el parametro en un 
solo valor o punto. El gerente de la tienda puede seleccionar una muestra de n = 500 clientes y hallar el gasto 
promedio de X = US$37. 10. Este valor sirve como una estimacion puntual para la media poblacional. 

Una estimacion por intervalo especifica el rango dentro del cual esta el parametro desconocido. El gerente 
puede decidir que la media poblacional esta en algun sitio entre US$35 y US$38. Tal intervalo con frecuencia va 
acompanado de una afirmacion sobre el nivel de confianza que se da en su exactitud. Por tanto se llama intervalo 
deconfianza(I.C). 
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Estimador Un estimador puntual utiliza un numero unico o valor para localizar una 
estimaeion del parametro. Un intervalo de confianza denota un rango dentro del cual 
puede eneontrarse el parametro, y el nivel de confianza que el intervalo contiene del 
parametro. 


En realidad hay tres niveles de confianza relacionados comunmente con los intervalos de confianza: 99, 95, y 
90%. No hay nada magico sobre estos tres valores. Se podria calcular un intervalo de confianza del 82% si se 
deseara. Estos tres niveles de confianza, denominados coeficientes de confianza, son simplemente convencionales. 
El gerente mencionado anteriormente puede tener un 95% de confianza en que la media poblacional esta entre 
US$35 y US$38. 

Las estimaciones por intervalo gozan de ciertas ventajas sobre las estimaciones puntuales. Debido al error de 
muestreo, probablemente Xno sera igual a pi. Sin embargo, no hay manera de saber que tan grande es el error de 
muestreo. Por tanto, los intervalos se utilizan para explicar esta discrepancia desconocida. 

Se iniciara con una discusion sobre lo que es un intervalo de confianza y como interpretarlo. 


A. El fundamento de un intervalo de confianza 

Un intervalo de confianza tiene un limite inferior de confianza (LIC) y un limite superior de confianza (LSC). 
Estos lfmites se hallan calculando primero la media muestral, X . Luego se suma una cierta cantidad a X para 
obtener el LSC, y la misma cantidad se resta de X para obtener el LIC. La determination de dicha cantidad es el 
tema de este capftulo. 

£ Como se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza en que 
contiene pi, si incluso no se sabe cual es la media poblacional? Vale la pena recordar de la discusion anterior sobre 
la Regia Empfrica que el 95.5% de todas las medias muestrales caen dentro de dos errores estandar de la media 
poblacional. Entonces la media poblacional esta maximo a dos errores estandar del 95.5% de todas las medias 
muestrales. Por tanto, al comenzar con cualquier media muestral, si se pasa de dos errores estandar por encima de 
dicha media y dos errores estandar por debajo de ella, se puede tener un 95.5% de confianza en que el intervalo 
resultante contenga la media poblacional desconocida. 

La discusion sobre distribuciones de muestreo mostro que de toda poblacion se pueden obtener muchas 
muestras diferentes de un tamano dado, cada una con su propia media. La figura 7.1 muestra seis de estas medias 
muestrales posibles. Si la muestra da X r un intervalo que se extiende dos errores estandar por encima y dos 
errores estandar por debajo de todavia incluye el valor desconocido de la media poblacional. De igual forma, 
si la muestra hubiese dado una media de X 2 , el intervalo resultante tambien incluirfa la media poblacional. Vale la 
pena destacar que solo X 3 y X 5 quedan tan lejos de la media poblacional que un intervalo de ± 2 errores estandar 
no incluye la media poblacional. Todas las otras muestras consideradas produciran un intervalo que contiene la 
media poblacional. Entonces, la clave para recordar es esta: como la media poblacional esta a lo mas a dos errores 
estandar para el 95.5% de todas las medias muestrales, entonces dada una media muestral cualquiera, se puede 
estar 95.5% seguro de que el intervalo de dos errores estandar alrededor de dicha media muestral contiene la 
media poblacional desconocida. 

Si se desea construir un intervalo mas convencional del 95% (en lugar del 95.5% discutido anteriormente), 
^cuantos errores estandar se debe mover por encima y por debajo de la media muestral? Como lo demuestra la 
figura 7.2, debido a que la tabla Z contiene valores solo para el area que esta por encima o por debajo de la media, 
se debe dividir el 95% por 2, produciendo 0.4750. Luego, se halla el valor de Z, correspondiente a un area de 0.4750, 
el cual es Z = 1 .96. Asi, para construir un intervalo de confianza del 95%, simplemente se especifica un intervalo 
de 1.96 errores estandar por encima y por debajo de la media muestral. Este valor del 95% es llamado coeficiente 
de confianza. 
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Coeficiente de confianza El coeficiente de confianza es el nivel de confianza que se 
tiene en el que el intervalo contenga el valor desconocido del parametro. 


Quiza se puede ilustrar mejor utilizando un ejemplo. Se comienza desarrollando una estimacion por intervalo 
para la media poblacional con una muestra grande ( n > 30). 


7.2 Intervalo de confianza para la media poblacional - 
Muestras grandes 

Uno de los usos m&s comunes de los intervalos de confianza es estimar la media poblacional. Un fabricante puede 
querer estimar la produccion mensual promedio de su planta; un representante de mercadeo puede interesarse en 
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la reduction en las ventas semanales promedio; el jefe financiero de una firma, que aparece entre las 500 mejores 
firmas en la revista Fortune , puede querer estimar los rendimientos trimestrales promedio que se tuvieron en 
operaciones corporativas. El numero de circunstancias que se encuentran comunmente en el mundo de los 
negocios y que requiere de una estimacion de la media poblacional es casi ilimitado. 

Se debe recordar que el intervalo se forma utilizando la media muestral como una estimacion puntual para el 
cual se adiciona y se resta un cierto valor para obtener los limites superior e inferior del intervalo de confianza, 
respectivamente. Por tanto el intervalo es 


Intervalo de confianza para estimar fi 
cuando a es conocido 


I.C. para estimar fi = X ± Za s 


[7.1] 


Cuanto debe sumarse y restarse, depende en parte del nivel de confianza deseado, estipulado por el valor de 
Z en la formula (7. 1 ). Un nivel de confianza del 95% requiere un valor de Z de 1 .96 (0.95/2 = 0.4750). El area de 0.4750 
corresponde a un valor de Z de 1.96. 

Consideremos el caso de un promotor inmobiliario quien intenta construir un gran centro comercial. Puede 
estimar en el area el ingreso promedio por familia como indicador de las ventas esperadas. Una muestra de n = 100 
familias da una media de X- US$35,500. Se asume que la desviacion estandar poblacional es o- US$7,200. Dado 

que a = se estima un intervalo del 95% como 
Vn 

7 200 

I.C. para estimar fi = 35,500 ± (1.96) — ~== 

= 34,088.80 < /I < 36,911.20 


A. Interpretation de un intervalo de confianza 

El promotor puede interpretar los resultados de su intervalo de confianza de dos formas. La primera, y la mas 
comun, establece que el promotor tiene un “95% de confianza en que la media poblacional real desconocida este 
entre US$34,088.80 y US$36,91 1 .20”. Aunque el valor real para la media poblacional sigue siendo desconocido, el 
promotor tiene un 95% de confianza en que este entre estos dos valores. 

La segunda interpretacion reconoce que se pueden desarrollar muchos intervalos de confianza diferentes. 
Otra muestra probablemente producirfa una media muestral diferente debido al error de muestreo. Con una X 
diferente, el intervalo tendria limite superior e inferior distintos. Por tanto, la segunda interpretacion establece 
que si se construyen todos los N C n intervalos de confianza, el 95% de ellos contendra la media poblacional 
desconocida. 

Si una segunda muestra da una media de US$35,600 en lugar de US$35,500, el intervalo es 

I.C. para estimar fx ~ $35,600 ± (L96) ^ ~ ^= ^ 

= US$34, 188.80 < fi < US$37,011.20 

El promotor puede estar un 95% seguro de que la media poblacional esta comprendida entre US$34,188.80 y 
US$37,01 1 .20. Si todos los intervalos posibles se construyeran con base en todas las medias muestrales diferentes, 
el 95% de ellas contendrfa la media poblacional desconocida. 

Esto por supuesto significa que el 5% de todos los intervalos estarfa errado - no contendrian la media 
poblacional-. Este 5%, hallado como (1 - coeficiente de confianza), es denominado el valor alfa y representa la 
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probabilidad de error. El valor alfa es la probabilidad de que cualquier intervalo dado no contenga la media 
poblacional. 


Valor alfa Es la probabilidad de error o la probabilidad de que un intervalo dado no 
contenga la media poblacional desconocida. 


B. Intervalo de confianza cuando a es desconocida 

La formula (7.1) requiere la suposicion improbable que la desviacion estandar poblacional o es conocida. En el 
evento probable que o sea desconocida, la desviacion estandar de la muestra debe substituirse: 


Intervalo de confianza para estimar /i - _ 

cuando <T es desconocida 1 c ^ ~ x ± z ’> 


[7.2] 


en donde s* ~ 5 ’A / ^ 

Gerry Gerber, CPA, acaba de registrar las declaraciones de impuestos de sus clientes. Desea estimar la cantidad 
promedio que deben al Servicio de Renta Interna. De los 50 clientes que selecciono en su muestra, la cantidad 
promedio que se adeudaba era de US$652.68. Ya que la desviacion estandar de todos sus clientes ctes desconocida, 
Gerber debe estimar crcon la desviacion estandar de la muestra de 5 1 = US$21 7.43. Si se desea un nivel del 99% de 
confianza, el valor de Z apropiado es 2.58 (0.99/2 = 0.4950). De la tabla Z, un area de 0.4950 revela que Z = 2.58. 
Utilizando la formula (7.2) 


I.C. para estimar fi = X ± Zs k 
= US$652.68 
= US$573.35 

El senor Gerber puede tener un 99% de confianza en que la cantidad promedio que deben todos sus clientes al 
Servicio de Renta Interna (SRI) esta entre US$573.35 y US$732.01 . 

^Que pasarfa a este intervalo si el senor Gerber estuviera dispuesto a aceptar un nivel de confianza del 95 %? 
Con un valor de Z de 1.96, el intervalo serfa 


± 2.58 


US$217.43 


V50 
< jjl < 732.01 


US$652.68 ± 1.96 
US$592.41 < /x < 


US$217.43 

V50 

US$712.96 


Los resultados son tanto buenos como malos. Las buenas noticias son que el intervalo del 95% es mas 
estrecho y ofrece mayor precision. Un intervalo amplio no es especialmente util. Revelana muy poco si el profesor 
ie pidiera que la media del siguiente examen estuviera entre elOyel 100%. Entre mas estrecho sea el intervalo, mas 
significativo es. 

Las malas noticias son que el senor Gerber ahora esta el 95% seguro de que el intervalo contiene en realidad 
jla. Aunque el intervalo es mas preciso (mas estrecho), la probabilidad de que contenga jit se ha reducido del 99 al 
95%. El senor Gerber tuvo que abandonar algo de confianza y ganar mas precision. 
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La pantalla 7.1 muestra la impresion en Minitab de la declaration de impuestos del senor Gerber (TXRET). 
Haciendo clic en Stat > Basic Statistics > 1-sample Z e ingresando 99% para el Confidence Interval Level y 217.43 
para Sigma, el senor Gerber obtiene su estimado por intervalo, el cual difiere solo levemente por encima de sus 
c&lculos manuales, debido a la aproximacion. 


Pantalla 7.1 

MTB > ZIntervalo 99.0 

217.434338 Cl 




Confidence intervals 

(Intervalos de confianza) 



The assumed sigma (El 

sigma asumido) = 

217 




Mean 

St Dev 

SE Mean 

C.I. 

Variable 

N (Media) i 

(Desviacion estandar) (Media SE) 99.0 % 

(I.C. ) 

TXRET (Declaracion 
de impuestos) 

50 652.7 

217.4 

30.7 ( 573.4, 

731.9) 


Ejemplo 7.1 

Checkered Cabs planea comprar una flota de nuevos taxis para sus operaciones en Miami. La 
decision depende de si el rendirdiento del auto en consideration es por lo menos 27.5 millas por 
galon de gasolina. Los 36 carros que prueba la compama reportan una media de 25.6 millas por 
galon (MPG), con una desviacion estandar de 3.5 MPG. A un nivel de confianza del 99%, £que 
aconsejarfa a Checkered que hiciera? 


Solution 


Setiene que el intervalo de confianza I.C. para estimar fx = 25.6 ± (2.58) 


3.5 
V36 

24.10 < fi < 27.11 


Interpretation 

Puede estar un 99% seguro de que las MPG promedio de este carro es menor que el minimo de 27.5 
requerido. Usted deberfa aconsejar a Checkered que busque un modelo altemativo. 


Ejercicios de la seccion 


1. En que se diferencian las estimaciones puntuales de las estimaciones por intervalo? 

2. Si la media poblacional es desconocida, ^como es posible dar un nivel de confianza a su estimado por 
intervalo? Incluya una grafica en su respuesta. 

3. Un intervalo del 90% para estimar la ganancia promedio de peso de los ratones de laboratorio oscila entre 
0.93 onzas y 1.73 onzas. ^Como interpretaria estos resultados? ^Que valor de Z se utilizo en el estimado? 

4. Cien latas de 16 onzas de la salsa de tomate Jake’s Mom’s tienen un promedio de 15.2 onzas. La desviacion 
estandar poblacional en peso es de 0.96 onzas. £ A un nivel de confianza del 95% las latas parecen estar llenas 
con un promedio de 16 onzas? 

5. Para estimar el gasto promedio de los clientes en el McDonald’s local, los estudiantes de una clase de 
estadfstica toman una muestra de 200 clientes y encuentran un gasto promedio de US$5.67, con una desviacion 
estandar de US$1.10. ^Cual es el intervalo de confianza del 95% para los gastos promedio de todos los 
clientes? Interprete sus resultados. 
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6. Un estudio realizado por los profesores en una universidad de Kansas esta disenado para ofrecer inferencias 
sobre las tasas de desempleo por condado en Estados Unidos. Una muestra de 200 condados reporta una 
tasa promedio del 6.2%, con una desviacion estandar del 1.7%. A un nivel de confianza del 90%, ^cual es el 
estimado de la tasa de desempleo promedio por condado en la nation? Interprete sus resultados. 

7 . Despues de observar 50 programas de television seleccionados aleatoriamente, la Asociacion Nacional de 
Education {National Education Association , NEA) reporto un promedio de 32.7 actos de violencia en 1997. 
Asuma una desviacion estandar muestral de 10.1. <,Cual serfa su estimation al 95% del numero promedio de 
actos violentos por programa que los ninos ven en la television? 

8. Un teatro de cine local desea desarrollar un intervalo para estimar las cajas promedio de palomitas de maiz que 
se venden por sala de cine. Si los registros llevados para 70 salas revelan un promedio de 54.98 cajas y una 
desviacion estandar de 12.7, calcule e interprete un intervalo de confianza del 92% para la media poblacional. 

9 . Una muestra de 1 2 1 llamadas al numero 900 que usted maneja tiene una duracion promedio de 1 6.6 minutos y 
una desviacion estandar de 3.63 minutos. Usted pretende discontinuar el servicio a menos que la duracion 
promedio sea superior a 18 minutos. En el nivel de confianza del 90% <[,cual es su decision? 

10 . ^Cual serfa su decision en el problema anterior a un nivel de confianza del 95%? ^Por que son diferentes los 
intervalos? 

11 . <[,Cual serfa su decision si el ejercicio 9 utilizara una muestra de 200 llamadas? ^Por que los intervalos son 

diferentes? 

7.3 Intervalo de confianza para la media en el caso de 
muestras pequenas - (a distribucion t 

En todos los ejemplos anteriores, el tamano de la muestra era mayor {n > 30). Sin embargo, no siempre puede ser 
posible obtener por lo menos 30 observaciones. Para una compama de seguros que prueba la resistencia al 
impacto de los autos, destruir a proposito 30 vehiculos de lujo puede vol verse un poco costoso. Un investigador 
medico que prueba una nueva medicina puede no encontrar 30 personas dispuestas a actuar como conejillo de 
indias. En muchos casos una muestra grande no es posible. 

Cuando debe tomarse una muestra pequena, la distribucion normal puede no aplicarse. El teorema del limite 
central asegura normalidad en el proceso de muestreo solo si la muestra es grande. Cuando se utiliza una muestra 
pequena, puede ser necesaria una distribucion altemativa, la distribucion t Student (o simplemente la distribucion 
t). Especificamente, la distribucion t se utiliza cuando se cumplen las tres condiciones: (1) la muestra es pequena, 
(2) o es desconocida, y ( 3) la poblacion es normal o casi normal. Si cres conocida, la distribucion Z se usa inclusive 
si la muestra es pequena. Ademas, si no puede asumirse una poblacion normal, se aumenta el tamano de la 
muestra para utilizar la distribucion Z y de no ser posible se debe confiar en las pruebas no parametricas . 

La distribucion t Student fue desarrollada en 1908 por William S. Gosset (1876 - 1937), quien trabajo como 
experto cervecero para Guinnes Breweries en Dublin, Irlanda. Guiness no permitia que sus empleados publicaran 
su investigation, de manera que Gosset (a quien le gustaba “jugar con los numeros para relajarse”) informo por 
primera vez sobre su distribucion t , aunque publico bajo el seudonimo de “Student” para proteger su trabajo. 

Al igual que la distribucion Z, la distribucion t tiene una media de cero, es simetrica con respecto a la media y 
oscila entre - oo y + oo. Sin embargo, mientras que la distribucion Z tiene una varianza de (f = 1, la varianza de la 
distribucion t es mayor que 1 . Por tanto, es mas plana y mas dispersa que la distribucion Z. La varianza para la 
distribucion t es 
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En realidad la distribucion t es una familia de distribuciones cada una con su propia varianza. La varianza 
depende de los grados de libertad (g.l.), definidos como el numero de observaciones que se pueden escoger 
libremente. Es el numero de observaciones menos el numero de restricciones impuestas sobre tales observaciones, 
en donde una restriccion es algun valor que tales observaciones deben poseer. Se asume que se tienen n - 4 
observaciones que deben producir una media de 10. La media de 10 sirve como una restriccion y hay n- 1=3 
grados de libertad. Por tanto, se pueden escoger tres observaciones cualquiera; por ejemplo se puede escoger 8, 
9 y 11. Despues de que se seleccionan estos tres valores, ya no hay libertad para escoger la ultima observation. 
El cuarto valor debe ser 12 si se quiere tener un promedio de 10. Vale la pena destacar en la figura 7.3 que a medida 
que n aumenta, la distribucion t se aproxima a la distribucion Z. Es por esto que se puede utilizar la distribucion Z 
cuando n > 30. 


Figura 7.3 

La familia 

de distribuciones t 



Grados de libertad El numero de observaciones menos el numero de restricciones 
impuestas sobre tales observaciones. 


Como se vera en breve, para todo conjunto de condiciones dadas la distribucion t producira un intervalo mas 
amplio que la distribucion Z, si esta se utilizara. Este ancho adicional es necesario debido a que se pierde algo de 
precision porque cres desconocida y debe estimarse. 

El estadistico t se calcula en gran parte como el estadistico Z. 



Reescribiendo (7.4) algebraicamente para expresarlo como un intervalo de confianza para estimar se tiene que 


Intervalo de confianza para _ s 

estimar la media poblacional IC - para estimar m =X± M0 t ) = x± t-^= [7.5] 

- muestras pequenas 


El valor apropiado de t puede hallarse de la tabla F en el apendice III. Para ilustrar, se asume que se desea un 
intervalo de confianza del 95% y se tiene una muestra de 20 observaciones. Debido a que n = 20, los grados de 
libertad son g.l. -n - 1 = 19. Bajando por la primera columna en la tabla F bajo “g.l.” hasta 19. Se mueve a traves de 
dicha fila hacia la columna encabezada por un nivel de confianza de 0.95 para las pruebas de dos colas. (Se ignoran 
las dos filas referentes a las pruebas de una cola. Estas se trataran en el capftulo 8). La entrada resultante de 2.093 
es el valor t apropiado para un intervalo de confianza del 95% con un tamano muestral de 20 (g.l. = 19). 
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Consideremos el siguiente problema tornado de The Wall Street Journal. Una empresa de construccion fue 
culpada de inflar los comprobantes que registra para los contratos de construccion con el gobiemo federal. El 
contrato establecio que un cierto tipo de trabajo deberfa promediar US$ 1 , 150. Por motivos de tiempo, los directivos 
de solo 12 agendas del gobiemo fueron llamados a dar testimonio ante la corte respecto a los comprobantes de 
la empresa. Si se descubrio a partir del testimonio una media de US$1,275 y una desviacion estandar de US$235, 
^un intervalo de confianza del 95% apoyaria el caso legal de la empresa? Se asume que los montos de los 
comprobantes son normales. 

Un nivel de confianza del 95% con g.l. = 12-1 = 11 resulta de la tabla F un valor t de 2.201 . Entonces 

s 

I.C. paraestimar fi ~ X ± t —p 

\n 

= 1275 ± (2.201)^ 

VI2 

= 1275 ± 149.31 
US$1,125.69 < n < US$1,424.31 

La corte puede tener un 95% de confianza en que el promedio de todos los comprobantes esta entre US$1,125 y 
US$1,424. Este intervalo condene los US$1 J 50 acordados, fortaleciendo la defensa de la empresa. 

Vale la pena destacar que el valor t para un intervalo del 95% es 2.201 (dado g.l. = 11), mientras que un intervalo 
del 95% de una muestra grande utiliza un valor Z de 1.96. El intervalo con base en un valor t es, por tanto, mas 
amplio. 


Ejemplo 7.2 

El contrato laboral realizado entre United Auto Workers (UAW) y Ford Motor Company (FMC) 
requirio que la produccion promedio para una section de production se realizara a 1 12 unidades 
por mes, por empleado. Surgieron desacuerdos entre UAW y FMC respecto a si se mantenfa este 
estandar o no. El contrato laboral especifico que si los niveles de produccion promedio se reducfan 
por debajo de la cantidad estipulada de /i = 1 12, a FMC se le permitirfa tomar “acciones correctivas”. 
Debido al costo implicado, solo se evaluaron 20 trabajadores, resultando una media de 1 02 unidades. 
Se asume que se encontro una desviacion estandar de 8.5 unidades y que los niveles de produccion 
estan distribuidos normalmente. ^Un intervalo de confianza del 90% tiende a sugerir una 
contravention del contrato laboral, permitiendo asi una accion correctiva? 


Solucion 


Con un nivel de confianza del 90% y n - 1 19 g.l., la tabla F da un valor t de 1 .729. 


I.C. paraestimar jx = X ± t 


Vn 


= 102 ± (1.729) 

= 102 ± 3.29 
98.71 < fx < 105.29 


8.5 

V20 


El nivel de produccion promedio de 112 unidades, especificado en el contrato laboral, no esta 
dentro del intervalo de confianza. 


Interpretacion 

Hay un nivel de confianza del 90% en el que el contrato esta siendo violado. FMC esta en su 
derecho para interponer un recurso por retraso en la productividad. 
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Obviamente, decidir si utilizar un estadistico t o Z es crucial. La figura 7.4 ayudara en la seleccion del estadistico 
apropiado. Vale la pena recordar que la distribucion t deberia utilizarse cuando todas estas tres condiciones estan 
presentes: (1) la poblacion es normal, (2) se toma una muestra pequena, y (3) exes desconocido. 


Figura 7.4 


Utilice Z 


Seleccion del estadistico 


sr 



Utilice Z 
Utilice Z 


Utilice t 


Utilice Z (debido al teorema del 
limite central) 


Utilice Z (debido al teorema 
del limite central) 

Utilice estadistica no 
parametrica 

La estadistica no 
parametrica se discutira en 
un capitulo posterior 


No 


Utilice estadistica no 
parametrica. 


Ejercicios de la seccion 


12. ^Cuales tres condiciones se deben cumplir antes de que se pueda utilizar la distribucion ft 

13. ^En que se diferencia la varianza de la distribucion t de la de la distribucion Z? Si un conjunto de datos tiene 
17 observaciones, ^cual es la varianza de la distribucion ft 

14. The Lucky Lady, una tertulia estudiantil popular, vende vasos de cerveza de 16 onzas. Diez estudiantes 
compran un total de 22 vasos, y utilizando su propia taza de medida, estiman los contenidos promedio. La 
media muestral es de 15.2 onzas, con s = 0.86. ^Con un nivel de confianza del 95% los estudiantes creen que 
su dinero lo vale? Interprete el intervalo. 

15. Dell Publishings muestrea 23 paquetes para estimar el costo postal promedio. La media muestral es de 
US$23.56, con s = US$4.65. 
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a . El editor senior de Dell espera mantener el costo promedio por debajo de US$23 .00. Calcule e interprete el 
intervalo de confianza del 99%. [E\ editor estara satisfecho? 

b. Compare los resultados de la parte a con el intervalo de confianza del 99% , si ^ = US$2.05 . Explique por que 
existe diferencia. 

a Manteniendo s = US$4.65, compare los resultados de la parte a con el intervalo del 95%. Explique la 
diferencia. 

16 . Las bonificaciones para 10 nuevos jugadores de la Liga Nacional de Futbol se utilizan para estimar la 
bonification promedio para todos los nuevos jugadores. La media muestral es de US$65,890 con s = US$ 1 2,300. 
^Cual es su estimacion con un intervalo del 90% para la media poblacional? 

17 . Una muestra de 25 llamadas a Psychic Friends Network (Red de Amigos Sfquicos) revela un costo promedio 
de US$23.87. Si la desviacion estandar es US$9.56, ^cual es la estimacion con un intervalo del 98% para el 
costo promedio de todos los que llaman para conocer su futuro? 

18 . Greenleaf Lawn Care descubre que el costp promedio de adomar los jardines de 20 casas del area es de 
US$2,365, con 5 = US$983. A1 nivel de confianza del 99%, ^que costo promedio estimarfa usted para adornar 
los jardines de todas las casas del area? 


7.4 Intervalo de confianza para la proporcion poblacional 

Las decisiones dependen con frecuencia de parametros que son binarios, parametros con solo dos posibles 
categorfas dentro de las cuales pueden clasificarse las respuestas. En este evento, el parametro de interes es la 
proporcion poblacional. Una empresa puede desear saber que proporcion de sus clientes paga a credito en 
oposicion a quienes utilizan efectivo. Las corporaciones con frecuencia estan interesadas en que porcentaje de 
sus productos son defectuosos en oposicion al porcentaje que no es defectuoso, o que proporcion de sus 
empleados renuncian despues de un ano en contraste con la proporcion que no renuncia despues de un ano. En 
cada uno de estos casos, existen solo dos posibles resultados. Por tanto, la preocupacion se concentra en la 
proporcion de respuestas que queda dentro de uno de estos dos resultados. 

En el capitulo anterior se encontro que sin 7ty n (l - n) son ambos mayores que 5, la distribucion de las 
proporciones muestrales sera normal y la distribucion muestral de la proporcion muestral tendra una media igual 
a la proporcion poblacional n y un error estandar de 


El error estandar de la distribucion muestral _ Ml - n) 

de las proporciones muestrales p V n 


[7.6] 


Sin embargo, la formula (7.6) contiene 7i, el parametro que se desea estimar. Por tanto, la proporcion muestral p se 
utiliza como estimador de n. 

La formula (7.6) puede replantearse como 


Estimacion del error estandar de 
la distribucion de las 

IpO - p) 
s = -J-- 

[7.7] 

proporciones muestrales 

' V n 



El intervalo de confianza es entonces 
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El gerente de una estacion de television debe determinar en la ciudad que porcentaje de casas tiene mas de un 
televisor. Una muestra aleatoria de 500 casas revela que 275 tienen dos o mas televisores. ^Cual es el intervalo de 
confianza del 90% para estimar la proportion de todas las casas que tienen dos o mas televisores? Dados estos 
datos,/? = 275 / 500 = 0.55, y 

/(0.55)(0.45) 

\ 500 

= 0.022 

La tabla E da un valor de Z de 1 .65 para un intervalo de confianza del 90%. 

I.C. para estimar 77 = 0.55 ± (1.65)(0.022) 

= 0.55 ± 0.036 
0.514 < 77 < 0.586 

El gerente puede tener un 90% de confianza que entre el 5 1 .4% y el 58.6% de las casas de la ciudad tienen mas de 
un televisor. 


Ejemplo 7.3 

Las empresas de busqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y 
asegurar talento para la alta gerencia. Tales firmas denominadas “cazadoras de cabezas” son 
responsables de la ubicacion de muchos de los mejores directores ejecutivos de la nation. Business 
Week reporto recientemente que “uno de cada cuatro directores ejecutivos es una persona de fuera 
-un ejecutivo con menos de 5 anos en la compama que maneja-”. Si en una muestra de 350 
compamas de los Estados Unidos, 77 tienen directores ejecutivos de fuera, £un intervalo del 99% 
de confianza apoyarfa la afirmacion? 



LC. para estimar 77 = p ± Zs p 

= 0.22 ± (2.58X0.022) 
0.163 < 77 < 0.277 


Interpretation 

Se conffa en que al nivel del 99% entre el 16.3% y el 27.7% de las empresas de Estados Unidos 
tienen directores ejecutivos de fuera. La afirmacion esta apoyada por tales descubrimientos, ya que 
el 25% esta contenido dentro del intervalo. 
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Ejercicios de la seccion 


19 . Que es s p y que mide? 

20 . CNN informo que el 68% de todos los estudiantes de secundaria tenfa computadores en sus casas. Si una 
muestra de 1 ,020 estudiantes re vela que 673 tienen computadores caseros, ^un intervalo del 99% apoya a CNN? 

21 . Como respuesta al nuevo furor de fumar cigarrillo que arrasa la nacion, el Instituto Nacional del Corazon 
(National Heart Institute) practico encuestas a mujeres para estimar la proporcion de quienes fumaban un 
cigarrillo ocasionalmente. De las 750 mujeres que respondieron, 287 respondieron que si lo hacian. Con base 
en estos datos, ^cual es su estimation al 90% para la proporcion de todas las mujeres que participan de este 
habito? 

22 . La Asociacion Nacional de Viajes (National Travel Association) tomo muestras de las personas que tomaban 
vacaciones en Irlanda para estimar la frecuencia con la cual los norteamericanos visitaban Emerald Isle. ^Cual 
es el intervalo de confianza del 96% para la proporcion de turistas que son norteamericanos, si 1,098 de los 
3,769 encuestados portaban pasaportes de Estados Unidos? 

23. De los 1,098 turistas norteamericanos 684 habian registrado su viaje a traves de un agente de viajes. Calcule 
e interprete el intervalo del 95% para la proporcion de todos los norteamericanos que utilizan los servicios de 
agencias de viajes profesionales en Irlanda. 

24 . Si 896 de los turistas norteamericanos recomendaran al viaje a sus amigos, £que porcentaje de todos los 
turistas norteamericanos harian lo mismo con un nivel del 99% de confianza? 

25 . Si 796 de los 1 ,098 turistas norteamericanos planean viajes para regresar a Irlanda, con un nivel de confianza 
del 92%, ^que proporcion de todos los turistas norteamericanos repetirian sus vacaciones? 


7.5 Control del ancho de un intervalo 

Como se expreso anteriormente, es preferible un intervalo mas estrecho debido a la precision adicional que 
proporciona. Hay dos metodos principales para lograr un intervalo mas preciso: (1) reducir el nivel de confianza 
y (2) incrementar el tamano de la muestra. 

A. Reduccion del nivel de confianza 

Ya se ha visto, en el intento del senor Gerber por estimar la declaration de impuestos promedio de sus clientes, que 
un incremento en la precision puede obtenerse aceptando un nivel inferior de confianza. Su intervalo de confianza 
del 99% oscilaba entre US$573 y US$732, mientras que el intervalo del 95% era mas estrecho de US$594 a US$712. 
Esto resulto del hecho que el intervalo de confianza del 99% requirio un valor de Z de 2.58 en lugar de 1.96 que 
utiliza el intervalo del 95%. 

Sin embargo, habia un costo involucrado en lograr esta precision mayor: el nivel de confianza bajo a 95%, 
produciendo un 5% de probabilidad de error en lugar del 1% relacionado con el intervalo de confianza del 99%. 
^Existe alguna manera en la que se pueda reducir el intervalo sin sufrir una perdida de confianza? Si, incrementando 
el tamano muestral. 


B. Incremento del tamano muestral 

Incrementando el tamano muestral se puede reducir el error estandar a/V7T. Si el tamano muestral del senor Gerber 
se incrementa a 80, el intervalo del 99% presenta un grado de precision similar al intervalo mas estrecho del 95%, 
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sin ninguna perdida de confianza. Con n = 80, el intervalo del 99% es 

US$217.43 

I.C. paraestimar jjl = US$652.68 ± 2.58 — — 

US$589.96 ^ fi < US$715.39 

Esto esta muy cercano al intervalo mas preciso del 95% de US$592,41 a US$712,96, pero mantiene un nivel de 
confianza del 99%. 

Infortunadamente, esta ventaja no se gana sin un precio. El tamano mas grande de la muestra significa mas 
tiempo y mas dinero que deben gastarse al recolectar y manejar los datos. De nuevo, debe tomarse una decision. 
Se vuelve una decision gerencial respecto a que metodo tomar. 


7.6 Determination del tamano apropiado de la muestra 

El tamano de la muestra juega un papel importante al determinar la probabilidad de error asi como en la precision 
de la estimation. Una vez que se ha seleccionado el nivel de confianza, dos factores importantes infiuyen en el 
tamano muestral: (1) la varianza de la poblacion a 2 y (2) el tamano del error tolerable que el investigador esta 
dispuesto a aceptar. Mientras que el primer factor esta mas alia del control del investigador (no hay nada que se 
pueda hacer sobre la varianza de la poblacion), si es posible limitar el tamano del error. 

El tamano del error que un investigador puede tolerar depende de que tan crftico es el trabajo. Algunas tareas 
extremadamente delicadas requieren de resultados exactos: los procedimientos medicos vitales de los cuales 
dependen vidas humanas, o la production de piezas de una maquina que deba cumplir medidas precisas, pueden 
tolerar solo un pequeno error. En otros casos, los errores mas grandes pueden tener consecuencias menos 
graves. 

Se supone que en la fabrication de una pieza para los reproductores de discos compactos (CD), un error de 2 
milimetros (mm) en el diametro no causarfa problema alguno; sin embargo, todo error superior a 2 mm resultara en 
un reproductor defectuoso. Si una pieza puede variar por encima y por debajo de algun diametro deseado en 2 mm, 
se permite un intervalo de 4 mm. Todo intervalo dado es dos veces el error tolerable. Ver la figura 7.5 para observar 
una ilustracion. 


Figura 7.5 

El error tolerable 
es la mitad 
del intervalo 



En esta section se considera la determination del tamano muestral apropiado bajo varias condiciones. 


A. Tamano de la muestra para estimar fi 

Vale la pena recordar que la desviacion normal Z puede expresarse como 
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X - IJL X - p, 

crj cr/Vn 


Esto puede reescribirse algebraicamente como 


Tamano muestral para intervalos _ Z 2 tr 2 

de la media poblacional (X - m ) 2 


[7.9] 


en donde la diferencia entre la media muestral y la media poblacional {X - jX) es el error. En el ejemplo anterior de los 
reproductores de CD’s, con un error tolerable de 2 mm, la formula (7.9) se escribirfa como 

Z 2 a 2 

" (2) 2 

El valor de Z depende del nivel de confianza requerido. Esto deja por determinar solo a 2 para calcular el tamano 
muestral apropiado. En el evento probable que a 2 sea desconocido, puede estimarse mediante la desviacion 
estandar muestral s, utilizando una muestra piloto de cualquier tamano razonable (n> 30). La varianza calculada 
de esta muestra preliminar puede entonces utilizarse en la formula (7.9). 

Por ejemplo, se asume que el fabricante de los reproductores de discos compactos desea construir un intervalo 
del 95% para el tamano promedio de la pieza. Una muestra piloto ha revelado una desviacion estandar de 6 mm. 
^Que tan grande deberfa ser la muestra? Un intervalo del 95% da un valor de Z de 1 .96. Por tanto, 


n 


( 1.96) 2 (6) 2 

(2) 2 


= 34.5 o 35 


El fabricante deberia seleccionar una muestra de 35 piezas. De esta muestra, un intervalo de 95% podrfa construirse 
para el tamano promedio. El intervalo tendria un error no superior a 2 mm. 


Ejemplo 7.4 

El propietario de un centro de esqui en el sur de Winsconsin esta considerando comprar una 
maquina para hacer nieve y ayudarle a la Madre Naturaleza a proporcionar una base apropiada para 
los entusiastas esquiadores. Si el promedio de nevadas parece insuficiente, piensa que la maquina 
deberia pagarse muy pronto por si misma. Planea estimar las pulgadas promedio de nieve que cae 
en el area, pero no tiene idea que tan grande deberia ser la muestra. Solo sabe que desea un 99% de 
confianza en sus hallazgos y que el error no debe exceder de 1 pulgada. El propietario le promete 
tiquetes gratuitos de temporada. ^ Us ted puede ayudarlo? 


Solucion 

Usted comienza con una muestra piloto grande ( n > 30) que produce una desviacion estandar de 3.5 
pulgadas. Por tanto, 

= zHs ) 2 

(error) 2 

= ( 2.58) 2 ( 3.5) 2 
( 1 ) 2 ~ 

= 81.5 


u 82 nevadas durante los ultimos anos. 
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Interpretation 

Ahora puede recolectar los datos sobre las ultimas 82 nevadas que se utilizaran para estimar las 
nevadas promedio. Con esta information el propietario puede determinar si la Madre Naturaleza 
necesita ayuda. Lo mas importante, usted puede pasar el resto del inviemo esquiando gratuitamente. 


B. Tamano de la muestra para estimar n 

En el capitulo 6 se encontro que 



en donde 


or n 


7r(l - t r) 


Se puede reescribir esto para producir una expresion para el tamano muestral 


Tamano muestral para intervalos = l - \ r) 

para la proporcion poblacional ( p - n) 2 


[7.10] 


en donde (p - n) es la diferencia entre la proporcion muestral y la proporcion poblacional, y por tanto es el error. 

La formula (7.10) requiere el valor de n. Sin embargo, n es el parametro que se desea estimar y es desconocido. 
Este problema puede tratarse en una de las dos maneras. Se podna tomar una muestra piloto para obtener un valor 
preliminar para 7t, tal y como se hizo al determinar el tamano muestral apropiado para la media. O se puede 
determinar que n = 0.5, para efectos de determinar el tamano muestral. Frecuentemente se prefiere este metodo 
porque es muy “seguro” o conservador - garantizara el tamano muestral mas grande posible, dado cualquier nivel 
de confianza y error deseados-. Esta muestra mds grande resulta del hecho que el numerador de la formula (7. 10), 
el cual contiene n (1 - k) es maximo (por tanto, n se maximizara) cuando n= 1 - n- 0.5. No existe valor distinto a 0.5 
que pueda asignarse a /rque haga mas grande n( 1 - k). Si n= 0.5, entonces n (1 - n) = 0.25. Todo valor distinto a 
0.5 resultarfa en 7t (1 - n) < 0.25. Por tanto, n seria mas pequeno. 

Wally Simpleton esta postulado para gobemador. El desea estimar dentro de 1 punto porcentual la proporcion 
de personas que votaran por el. Tambien desea tener el 95% de confianza en sus hallazgos. ^Que tan grande 
debena ser el tamano muestral? 

(1.96) 2 (0.5)(0.5) 

/? ( 0 . 0 1) 2 

= 9,604 votantes 

Una muestra de 9,604 votantes permitira a Wally estimar n con un error de un 1 % y un nivel de confianza del 95%. 


Ejemplo 7.5 

El consejo de la ciudad esta planeando una ley que prohfbe fumar en edificios publicos incluyendo 
restaurantes, tabemas, y teatros. Solo estara exenta la vivienda privada. Sin embargo, antes que 
dicha ley se lleve ante el consejo, este organismo desea estimar la proporcion de residentes quienes 
apoyan dicho plan. La carencia de toda habilidad estadistica obliga al consejo a contratarlo como 
consultor. Su primer paso sera determinar el tamano muestral necesario. Se le dice que su error no 
debe exceder del 2% y usted debe estar 95% seguro de sus resultados. 
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Solucion 

Debido a que no se tomo previamente una encuesta piloto, usted debe determinar temporalmente k 
en 0.5 para efectos de resolver el tamano muestral. 


Z 2 7r(l — 7 r) 
(error) 2 

(L96) 2 (Q.5)(0.5) 

(.02) 2 


= 2,401 ciudadanos 


Interpretation 

Con los datos suministrados ppr las 2,401 personas usted puede proceder con su estimacion de la 
proporcion de todos los residentes quienes estan a favor de la ley. El consejo puede tomar su 
determination respecto a la polftica que se aplicara en toda la ciudad sobre el hecho de fumar. 


Ejercicios de la seccion 


26. Days Inn desea desarrollar un intervalo de confianza del 99% para estimar el numero promedio de habitaciones 
ocupadas cada noche en sus localidades de toda la nacion. ^Cuantas noches deben incluirse en la muestra si 
se puede tolerar un error de 50 habitaciones y una muestra piloto re vela que s = 165 habitaciones? 

27. ^Que pasaria a su respuesta si s = 265? ^Por que? 

28. ^Que tan grande se requiere que sea una muestra para que proporcione una estimacion del 90% del numero 
promedio de graduados de las universidades de la nacion con un error de 2,000 estudiantes si una muestra 
piloto reporta que 5 = 8,659? 

29 . Un estudio que usted esta realizando requiere un intervalo del 95% para la tasa de rendimiento promedio que 
su empresa gana sobre los proyectos para presupuestar capital. ^Cuantos proyectos debe tener su muestra 
si su supervisor especifica un error maximo de solo el 5% y s = 2.3%? 

30. Como empleado recien contratado en la division de mercadeo para un importante asunto sobre ventas 
minoristas, a usted se le ha asignado la tarea de estimar la proporcion de consumidores que prefieren su 
producto al de la competencia. ^Cuantos consumidores se deben tomar en la muestra si usted desea restringir 
el error al 10%, pero sin embargo desea proporcionar un nivel de confianza del 99%? 

31. ^Que tan grande debe ser la muestra del problema anterior si el error se restringe al 5%? Explique la diferencia. 

32. La division de creditos de un banco comercial grande desea estimar con un nivel de confianza del 99% la 
proporcion de sus creditos que estan en mora. Si el ancho del intervalo es del 7%, ^cuantos creditos deben 
revisarse? ^Cual es el error tolerable? 


7.7 Propiedades de un buen estimador 

Debe hacerse una distincion entre un estimador y una estimacion. Un estimador es la regia o procedimiento, 
generalmente expresado como una formula, que se utiliza para derivar la estimacion. Por ejemplo, 



n 
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es el estimador para la media poblacional. Si el valor del estimador X es digamos 10, entonces 10 es la estimacion 
de la media poblacional. 


Estimadores y estimaciones Un estimador es el proceso mediante el cual se obtiene 
la estimacion. Una estimacion es el resultado numerico del estimador. 


Para desempenarse de manera confiable, los estimadores deben ser (1) insesgados, (2) eficientes, (3) consistentes, 
y (4) suficientes. Cada propiedad se discute a su tiempo en esta section. 

A. Estimador insesgado 

Como se observo en el capitulo 6, es posible construir una’ distribucion muestral seleccionado todas las muestras 
posibles de un tamano dado de una poblacion. Un estimador es insesgado si la media del estadfstico calculado en 
todas estas muestras es igual al parametro correspondiente. 

Sea 0 (la letra griega teta) el parametro que se intenta estimar mediante & (que se lee “teta sombrero”). 
Entonces 0e s un estimador insesgado si su media, o valor esperado, E ( 0 ), es igual a 6. Es decir, 

E(0) = 6 

Para citar un ejemplo especifico, Aes un estimador insesgado de ji porque la media de la distribucion muestral 
de las medias muestrales, X es igual a fi. Por tanto, 

E(X) = f = fi 


Estimador insesgado Un estimador es insesgado si la media de su distribucion 
muestral es igual al parametro correspondiente. 


La figura 7.6 ilustra como la media de una distribucion muestral debe ser igual al parametro correspondiente 
para garantizar un estimador insesgado. 


Figura 7.6 

Distribuciones 
para estimadores 
sesgados 
e insesgados 





Aqui es un estimador insesgado de 6 debido a que su distribucion esta centrada en 6. Por tanto, E(0 l ) = 0. 
Si se tomaran muchas muestras diferentes, produciendo muchos valores diferentes para 0 V su media seria igual a 
0. Y vice versa, si se toman muchas muestras y se calculara 0 2 cada vez, su media excederfa 0. Por tanto, 0 2 es un 
estimador sesgado (hacia arriba) de 0. La medida de sesgo es la diferencia entre la media de 0 2 y 0. Vale la pena 
notar que 
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mientras que 


£( 0 ,) - 6 = 0 

E{6 2 ) - 0 # 0 


6. Estimador eficiente 

La eficiencia de un estimador depende de su varianza. Sea 9 f y $ 2 dos estimadores insesgados de 9. Entonces 9 
es un estimador mas eficiente si, en muestreos repetidos con un tamano muestral dado, su varianza es menor que 
el de G r Es logico que un estimador con una varianza mas pequena estimara de forma mas proxima el parametro. 
Considerando la figura 7.7, la cual muestra las distribuciones muestrales con un tamano muestral dado de dos 
estadisticos 6 l y § r Tanto 6 { como 0 2 son estimadores insesgados de 6 debido a que sus distribuciones muestrales 
estan centradas en 6 , y 

£(0,) = E(9 2 ) = 6 

Sin embargo, la varianza de la distribucion muestral de 0, es menor que la de 9, . Los valores posibles para 9 : estan 
mas dispersos. Cualquier estimado de 6 utilizando 0, es probable que produzca un error de muestreo mas grande 
que un estimado de 9 que utiliza 


Figura 7.7 

La varianza 
de los 

estimadores 



e 


Un estimador eficiente Dado todo estimador insesgado, el estimador mas eficiente 
es aquel que tenga la varianza mas pequefia. 


C. Estimador consistente 

Un estimador es consistente cuando, a medida que n se incrementa, el estimador se aproxima al valor del parametro. 


Estimador consistente Un estimador es consistente si, a medida que n aumenta, el 
valor del estadistico se aproxima al parametro. 


Para que un estimado sea consistente, debe ser insesgado y su varianza debe aproximarse a cero a medida que n 
aumenta. La varianza de la distribucion muestral de las medias muestrales es oL, es <y 2 /n. A medida que n 
aumenta, cr 2 _se aproximara a cero. Por tanto, se puede decir que X es un estimador consistente de ji. 
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Si un estadistico no es un estimador consistente, tomar una muestra mas grande para mejorar su estimado sera 
infructuosa. 


D. Estimador suficiente 

Un estimador es suficiente si utiliza toda la informacion relevante sobre el parametro contenida en la muestra. Si 
un estimador es suficiente, nada puede ganarse utilizando cualquier otro estimador. 


Estimador suficiente Un estimador es suficiente si ningun otro estimador puede 
proporcionar mas informacion sobre el parametro. 


Esta discusion de las propiedades de urv estimador, por ningun motivo es una cuenta completa. Sin embargo, 
proporciona una base suficiente para una evaluation sobre la estimacion de parametros mediante la construction 
de intervalos de confianza. 


Problemas resueltos 

Artesian Spring Water proporciona agua embotellada, en contenedores de 15 galones, a las casas de un sector de 
tres condados. El gerente desea estimar el numero promedio de contenedores que una casa tipica utiliza cada mes. 
Se toma una muestra de 75 casas y se registra el numero de contenedores. La media es X = 3.2, con s = 0.78. 

a . . ^Que revelaria un intervalo de confianza del 92%? 


Solucion 

El valor de Z para un intervalo de confianza del 92% se halla dividiendo primero 0.92 por 2: asi 0.92/2 = 0.46. El area 
de 0.46 requiere un valor de Z de 1.75. entonces, 


I.C. para estimar fi — X ± (Z)s x 


= 3.2 ± (1.75) 


078 

V75 


3.04 < ii < 3.36 

El gerente puede estar 92% seguro de que el numero de contenedores promedio por mes esta entre 3.04 y 3.36. 


b. Sin embargo, el gerente siente que este intervalo es demasiado amplio. ^Cuantas casas deben tomar como 
muestra para estar 99% seguro de que el intervalo no esta errado en mas de 0.10 contenedores? 


Solucion 


n = 


_ZV = (2.58) 2 (0.78) 2 
(error) 2 (0.1) 2 


Una muestra de 405 daria un intervalo de confianza del 99%, con un error no superior a 0.10 contenedores. 

c. Se selecciona una muestra mas pequena de 10 casas para estimar el numero promedio de miembros de la 
familia por casa. Los resultados son 1 , 3, 4, 7, 2, 2, 3, 5, 6 y 6 personas en cada casa. ^Cuales son los resultados 
de un intervalo de 99% para el numero promedio de miembros de la familia? 
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Solucion 

La desviacion estandar de la muestra es s = 2.02 con una media de 3.9. Dada la muestra pequena, debe utilizarse un 
valor t de 1 001 9 = 3.250. Por tanto, 

I.C. para estimar fx ~ X ± ts x 

2 02 

= 3.9 ± (3.250) 

VlO 

1.82 < fx < 5.98 

d. De las 75 casas de la muestra, 22 tienen ablandadores de agua en casa. ^Cual es el estimado del intervalo del 
95% de la proporcion de todas las casas en el sector de tres condados que tiene ablandadores? 


Solucion 

Debido a que la proporcion muestral es p = 22/75 = 0.29, el error estandar es 


• /(pXl ~ p) /(0.29X0.71) 

^ V « = v— ^ — = 


e. 


Entonces, 


I.C. para estimar it = p ± Zs p 

= 0.29 ± (1,96X0.052) 
0.188 < 7T < 0.392 


Si un intervalo oscila entre el 18.8% y el 39.2% de todas las casas que tienen ablandadores y carece de 
precision, ^que tan grande debe tomarse una muestra para producir un intervalo de solo el 10%? 


Solucion 

Si el intervalo de confianza ha de ser del 10%, el error puede ser solo del 5%. Entonces, 


Z 2 ( Q. 5) (0,5) 
(error ) 2 


U.96) 2 (0.5)(0.5) 
(0.05 ) 2 


= 385 casas 


Lista de formulas 


[7.1] 

[7.2] 

[7.3] 
[7.5] 
[7.7] 


I.C. para estimar jx ~ X ± Zcr x 


I.C. para estimar fx — X ± Zs 7x 


n - 1 


n — 3 

I.C. para estimar /x ~ X ± ts* 


f p(l ~~ P ) 

n 


[7.8] 


I.C. para estimar it — p ± Zs p 


Intervalo de confianza para estimar 
/i cuando a es conocida 

Intervalo de confianza para estimar 
fj cuando a es desconocida 

Varianza para la distribucion t 

Intervalo de confianza para 
muestras pequenas 

Estimado del error estandar de la 
distribucion de las proporciones 
muestrales 

Intervalo de confianza para la 
proporcion poblacional 
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[7.9] 

[7-10] 


ZV 

" (X - p.) 2 

_ Z 2 (';r)(l - 7r) 
(p - tt) 2 


Tamano muestral para estimar f .1 
Tamano muestral para estimar n 


Ejercicios del capltulo 

33 . Se construye un intervalo del 95% de confianza, que da un iimite inferior de confianza de 62 y un lfmite 
superior de confianza de 69. ^Usted puede concluir de esto que existe un 95% de probabilidad que el parametro 
este entre 62 y 69? Explique. 

34 . En una encuesta de 500 gerentes, Posner Products encontro que 200 gerentes carecfan de suficiente 
capacitacion estadistica. 

a* iCua] es el estimado puntual de la proporcion de todos los gerentes de Posner que requieren trabajo 
adicional en analisis estadistico? 

b. <,Cual es el estimado del error estandar de la proporcion? 

c. iC ual es el intervalo de confianza del 90% para la proporcion poblacional? Interprete su respuesta. 

35 . Jose tiene un negocio prospero en Acapulco que vende restos incas de plastico a los turistas norteamericanos. 
El selecciona n = 60 dias para estimar su utilidad diaria. Sin embargo, Jose no sabe si la poblacion de utilidades 
diarias esta distribuida normalmente, y no esta seguro sobre como proceder. ^Que debe hacer? 

36 . Como experto en control de calidad usted desea estimar el grosor promedio de los lentes opticos producidos 
por su empresa. Una muestra de 120 lentes revela una media de 0.52 milimetros (mm). La desviacion estandar 
poblacional es de 0.17 mm. Usted considera que puede arriesgarse a una probabilidad de error de solo el 1%. 
Construya el intervalo de confianza apropiado. 

37 . ^Como cambiaria el problema anterior si afuera desconocida y la desviacion estandar de la muestra fuera de 
0. 17 mm? Calcule el intervalo. 

38 . Georgia Pacific (GP), una empresa papelera de Estados Unidos, decide sembrar un bosque maderero si puede 
obtener un promedio de por lo menos 700 pies cuadrados de tabla (b.f). Una muestra de 1,000 arboles da una 
media de 695 b.f, con una desviacion estandar de 22.1 b.f. 

a. Calcule el intervalo de confianza del 90%. 

b. Interprete su respuesta. 

c. ^Deberia GP sembrar el bosque? 

39 . En una encuesta a 6,000 personas realizada por U.*S. News & World Report se encontro que, en su tiempo de 
vida, el norteamericano promedio gasta seis meses sentado en los semaforos. Tomando esto como la media 
muestral, y asumiendo que la desviacion estandar es de 2.2 meses, ^cual es el intervalo de confianza del 90% 
para la media poblacional? Interprete su respuesta. 

40 . The Journal Retail Management reporto que una muestra de 600 compradores pasaban un promedio de 1.79 
horas en un centro comercial de visita. La desviacion estandar era de 0.83 hora. ^Cual es la estimacion por 
intervalo del numero promedio de horas que todos los compradores pasan en el centro comercial? Sea a- 0. 10. 

41 . Su producto requiere que un cierto componente utilizado en su fabricacion promedie 15.2 gramos. Si usted 
compra 100 componentes y encuentra que X= 14.8 gramos, con s = 3.2 gramos, ^,que le diria un intervalo de 
confianza sobre lo aconsejable de comprarle mas a este proveedor? Su producto es muy delicado y usted 
siente que puede tolerar solo el 1% de probabilidad de error. 
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42 . Si dadas las condiciones del problema anterior, la muestra hubiera dado una media de 14.1 gramos, ^que 
concluirfa? 

43 . Wally desea comprarle a su esposa para su cumpleanos un nuevo tanque septico. Siendo un comprador 
cuidadoso, el examina 40 modelos diferentes y encuentra un precio promedio de US$7 12, con una desviacion 
estandar de US$215. ^Cual es el intervalo de confianza del 95% para estimar el precio promedio de todos los 
tanques septicos? 

44 . Un fabricante de esquis de nieve desea estimar el numero promedio de viajes para esquiar que realizan los 
esquiadores avidos. Una muestra de 1,100 esquiadores da X= 15.3 viajes por temporada, con s = 5.1 viajes. 
^Cual es el intervalo de confianza del 99% para estimar la media poblacional? 

45 Considere los datos del ejercicio anterior: 

a. Sin resolver el problema, explique que pasaria al intervalo si el nivel de confianza se redujera al 90%. 

b. Solucione el problema con a = 0.10 y demuestre como la respuesta sustenta su respuesta a la parte a. 

46 . Un investigador descubrio que una muestra de 100, con X= 50.3 y $ = 10.1, genero un intervalo de confianza 
de 48,3204 a 52.2796. ^Que nivel de confianza puede atribuirse a este intervalo? 

47 . Los pesos de 25 paquetes enviados a traves de United Parcel Service (UPS) tuvieron una media de 3.7 libras 
y una desviacion estandar de 1 .2 libras. Halle el intervalo de confianza del 95% para estimar el peso promedio 
de todos los paquetes. Los pesos de los paquetes estan distribuidos normalmente. 

48 . Se registro una muestra de 12 donaciones por parte de comites de accion polftica (PAC’s) para los fondos de 
las campanas del congreso,en miles dedolares,de 12.1,8.3, 15.7,9.35, 14.3, 12.9, 13.2,9.73, 16.9, 15.5, 14.3y 
12.8. Calcule el intervalo de confianza del 90% para estimar la donation promedio realizada por PAC’s. Se 
asume que las donaciones son normales. 

49 . Las ganancias por accion para 10 acciones industriales cotizadas en el Dow Jones fueron US$1 .90, US$2.15, 
US$2.01, US$0.89, US$1.53, US$1 .89, US$2.12, US$2.05, US$1 .75 y US$2.22. Calcule un intervalo de confianza 
del 99% de los EPS de todas las acciones industriales cotizadas en el Indice Dow Jones. ^Que suposicion 
debe hacer usted? 

50 . El Dr. Bottoms, el proctologo local, descubrio que la edad promedio de 75 de sus pacientes era de 47.3 con 
una desviacion estandar de 10.9 anos. Calcule el intervalo de confianza del 99% para la edad promedio de 
todos sus pacientes bajo la suposicion de que las edades no estan distribuidas normalmente. 

51 . Durante el ultimo Superbowl Sunday (Domingo de Futbol) Sammy Salami y sus companeros ordenaron 27 
pizzas de Pizzas On Wheels. El tiempo promedio de entrega era de 23.7 minutos, con una desviacion estandar 
de 10.7 minutos. Al considerar que esta era una demora muy grande en su proposito culinario, Sammy y sus 
amigos decidieron comprar la pizza numero 28 en otra parte, si el tiempo de entrega de POW (Pizzas On 
Wheels) era superior a 30 minutos. Sea a 1 %. ^Ordenaran en otra parte? 

52 . Una gran empresa de contabilidad contrato un psicologo industrial para medir la satisfaccion laboral de sus 
socios mas antiguos. A 17 socios se les practico una prueba para medir la satisfaccion; los puntajes de las 
pruebas son normales y la varianza para todos sus socios es de 120. ^,Cual es el intervalo de confianza del 90% 
para el puntaje promedio? 

53 . Para estimar cuantos de los 350,000 residentes de Peoria desean un nuevo centro civico, el alcalde descubre 
que 1,570 de los 2,100 residentes a quienes se tomo como muestra expresaron su apoyo. Ayude al alcalde a 
construir e interpretar un intervalo de confianza del 90%. 

54 . De 209 clientes, 183 expresaron su satisfaccion con los servicios bancarios ofrecidos por First of America en 
Peoria, Illinois. ^Como se compara esto con los resultados de un estudio anterior por parte de River Valley 
Savings, el cual estimo al 99% del nivel de confianza que entre el 74.1 y el 83.7% de sus clientes estaban 
satisfechos? 
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55. Una empresa textil descubrio que soporta un factor de desperdicio total del 19%. Un nuevo proceso se 
implemento y una muestra de 1.376 unidades revelo un factor promedio de desperdicio de 11.1%, con una 
desviacion estandar del 1.12%. iQue conclusion puede sacarse con un intervalo de confianza del 95% acerca 
del beneficio del nuevo proceso? 

56. A los golfistas profesionales se les pidio calificar un nuevo palo de grafito en una escala de 0 a 10. Veinticinco 
pros generaron un rango promedio de 7,3, con 5 = 1 .01 . Construya e interprete el intervalo de confianza del 90%. 

57. El Premio Nacional de Calidad Baldrige, llamado asi en honor a Malcolm Baldrige, quien sirvio como secretario 
de comercio a finales de los anos 80’s, es un reconocimiento ampliamente codiciado del compromiso de una 
corporation con un sistema de gerencia de calidad total (TQM). Se especifican siete criterios mediante los 
cuales se juzgan las empresas. Uno de tales criterios, el liderazgo, permite a las organizaciones sumar hasta 
100 puntos para lograr este honor. Chrysler Corporation tomo muestras en 1 9 plantas y descubrio un promedio 
de 73.2 puntos, con s = 10.1. Construya e interprete el intervalo de confianza del 99% para todas las plantas 
de Chrysler. 

58. Pizza Pub esta considerando incrementar el precio de su pizza grande de encurtidos si el precio promedio de 
su competencia excede el precio de Pizza Pub de US$12.95. Otras 37 pizzerias reportan un precio promedio de 
US$12.50, con una desviacion estandar de US$1.01. Pizza Pub desea estar un 90% segura de sus hallazgos. 

59. En una encuesta de 673 tiendas minoristas, 521 reportaron un problema de robos por parte de los empleados. 
Puede usted concluir con un 99% de confianza, que estos datos sugieren que el 78% de todas las tiendas 
tiene una dificultad similar, como presento un informe recientemente CNN? 

60. Work and Roll, un restaurante de comida china para llevar, deseaba determinar que porcentaje de sus clientes 
seleccionan la sopa de nido de aves como parte de su cena placentera. 

a. En una muestra de 320 clientes, 220 se llevaron a casa esta delicia. Calcule e interprete un intervalo del 99%. 

b. Utilizando los datos anteriores, construya el intervalo del 90%. 

c. ^Por que obtuvo un intervalo mas pequeno? ^Seria siempre deseable reducir el ancho de intervalo de esta 
manera? 

61. The Jesse James First National Bank lo contrato como consultor estadistico para analizar las operaciones de 
sus cajeros automaticos. Una muestra de 15 mostro las transacciones promedio de US$4,810, con una 
desviacion estandar de US$1,202 por dia. Su supervisor insiste en que usted debe tener un 99% de confianza 
en su estimado del volumen diario promedio. ^Que puede decide? 

62. El propietario de un negocio pequeno desea estimar el tiempo promedio requerido para finalizar cierto trabajo. 
El debe asegurar que tiene un 90% de confianza en que el error sea menor que 0.5 minutos. La desviacion 
estandar es de 3.2 minutos. ^Cuantas observaciones de tiempos de finalization debe hacer? 

63. El decano de una universidad privada desea estimar el numero de estudiantes registrados que vienen de otro 
estado. Debe estar un 95% seguro de que el error es menos del 3%. iQue tan grande debe tomar la muestra? 
Si la muestra revela una proporcion del 3 1 % de estudiantes de otro estado, y hay 1 2,414 estudiantes, ^cuantos 
estudiantes estima usted que pro vienen de otros estados? 

64. A1 director de una sucursal de banco se le pide estimar el tiempo promedio que un cliente gasta en las 
instalaciones del auto-banco. Debe estar un 99% seguro de que el estimado no tenga un error superior a 15 
segundos. ^Cuantas observaciones debe hacer si la desviacion estandar conocida es de 2.7 minutos? 

65. En un esfuerzo por reducir el comercio de iniciado, la Comision de Bolsas y Valores ( Securities and Exchange 
Commission- SEC) solicito information respecto a la proporcion de bancos de empresas cuyos funcionarios 
poseen mas del 50% del capital en circulation de sus bancos. De las 200 companias seleccionadas 
aleatoriamente, 79 reportaron que sus funcionarios teman una mayoria de sus acciones. ^Cual es el intervalo 
de confianza del 90% para la proporcion de todos los bancos de empresas cuyos funcionarios tienen por lo 
menos un 50% de las acciones? 



] g4 ESTADISTICA APLICADA A LOS NEGQCIOS Y LA ECONOMIA 


66. Un investigador de la Administracion Federal de Aviacion ( Federal Aviation Administration , FAA) fue 
mencionado en una emision de febrero de The Washington Post , en la que dijo que de los 112 accidentes de 
aerolineas, “73 involucraban algun tipo de problema estructural con la aeronave”. Si tales cifras son 
representativas, ^cual es el intervalo de confianza para la proporcion de accidentes que involucran tal defecto 
estructural? Sea a= 0.0 L 

67. United Airlines hizo encuestas a 93 pasajeros en un vuelo de Cincinnati a Atlanta. Sesenta y cuatro dijeron 
que les hubiera gustado ir en un vuelo posterior si hubiese habido espacio disponible. United habia decidido 
que si mas del 50% de los pasajeros expresaba su interes en salidas en horas siguientes durante el dia, 
considerarfa la posibilidad de poner tales vuelos a disposition. Dados los resultados de la encuesta, ^un 
intervalo de confianza del 90% sugiere que deben hacerlo? 

68. The Wall Street Journal informo los esfuerzos realizados por Nestle, la compama de alimentos mas grande del 
niundo, para introducir un nuevo producto. La gerencia decidio utilizar el sector de Chicago como mercado de 
prueba. Si mas del 30% de las personas expresaban un deseo por el producto, ellos considerarian el 
comercializarlo en un sector mas amplio. De las 820 personas a quienes se les practico la prueba, 215 expresaron 
una reaction positiva. ^Un intervalo de confianza del 90% para la proporcion de todos los clientes quienes 
prefieren el producto hace que la gerencia continue con sus planes de comercializacion? 

69. Business Week presento uha historia sobre los esfuerzos realizados por los 12 paises miembros del Mercado 
Comun para abreviar la creciente ola de fusiones que se pensaba era “indeseable economicamente para los 
intereses intemacionales”. Se va a seleccionar una muestra para estimar el tamaiio promedio de las empresas 
(tal y como se mide en valor neto corporativo) involucradas en las fusiones. Si el intervalo debe ser de US$5.2 
millones y tener un nivel de confianza del 95%, ^que tan grande deberia ser la muestra si la desviacion 
estandar del valor neto corporativo se considera que es US$21.7 millones? 

70 . El director de su division le pide, como analista de mercadeo recientemente contratado, que estime las ventas 
semanales promedio. Le advierte que debe mantener el error dentro de US$100 y mantener un nivel de 
confianza del 90%. ^Cuantas semanas de datos debe recolectar si la desviacion estandar es US$750? 

71 . Una encuesta sobre la violencia en los colegios esta disenada para estimar el porcentaje de estudiantes de 
sexo masculino que fueron amenazados con violencia en los campos del colegio durante el ano pasado. El 
error tolerable se fija en 1%, y el nivel de confianza es del 99%. ^Cual es el tamano apropiado de la muestra? 

72 . La Asociacion de Finanzas Estudiantiles en Faber College esta planeando una “Feria Primaveral” en la cual 
intentan vender camisetas impresas con su logo. El tesorero desea un estimado de la proporcion de estudiantes 
que compraran una camiseta. El estimado debe proporcionar un nivel de confianza del 90% y el error no debe 
exceder del 3%. ^Que tan grande debe tomarse la muestra? 

73. Si un fabricante desea desarrollar un intervalo del 99% para la proporcion de defectos con un error de menos 
del 1%, ^que tan grande se necesita la muestra? 


Ejercicios por computador 

Telmark Technologies planted recientemente nuevas metas para que la compama incrementara el tamano promedio 
de ventas por cliente y mejorara el servicio ofrecido a los mismos. En el ultimo trimestre las ventas presentaron un 
promedio de US$373.10 por pedido del cliente y tomo un promedio de 4.5 dias para hacer el envio a los clientes. 
Ademas, los ejecutivos de alto nivel en Telmark desean reducir el peso promedio de los envios por debajo de la 
media de 55.8 libras para reducir los costos de envio. Hal Ketchum, vicepresidente para Relaciones del Producto, 
ha sido encargado de la responsabilidad de lograr tales objetivos. El dirige su staff de estadisticos a recolectar 
todos los datos necesarios y a preparar un informe detallando las condiciones actuales. 

Ingrese al archivo TELMARK de su disco de datos. Contiene los datos de los pedidos de ventas de 75 
clientes. El tamano de las ventas en cientos de dolares esta registrado como Size (tamano). El numero de dias que 
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tomo cada pedido en ser enviado al cliente se registra como Days (dfas) y la variable Weight (peso) proporciona 
datos de los pesos de los envios en libras. Finalmente, la variable SAT indica si el cliente quedo satisfecho con el 
servicio de Telmark. Esta codificado como “1” si el cliente quedo satisfecho y “0” si no quedo satisfecho. 

Utilizando los datos del archivo TELMARK, proporcione los estimados de intervalo para Size, Days y Weight 
de los envios. ^A que conclusion llega? Calcule el estimado del intervalo de la proportion de clientes satisfechos. 
Presente su informe estadistico terminado tal y como se describe en el apendice. Incluya todos los hallazgos 
relevantes, las conclusiones y las recomendaciones. 



Durante muchos anos el FBI (Federal Bureau of 
Investigation) ha servido como modelo para las agencias 
que hacen cumplir la ley. Los esfuerzos revolucionarios 
por parte del FBI por integrar de manera mas completa el 
uso del analisis estadistico en los esfuerzos por combatir el 
crimen se mencionaron en la seccion Escenario a comienzos 
de este capitulo. 

El mtiodo para combatir el crimen basado en la 
estadfstica incluye datos sobre una gran variedad de 
crimenes, asf como las caracteristicas y los habitos 
personales de los infractores. Aunque la vocera de Larry 
King Live no ofrecio detalles especfficos, establecio que se 
guardaban los datos sobre el numero de crimenes que cada 
transgresor de la ley comete, el numero de dfas que 
transcurren entre crimenes, y el numero de personas que 
son asesinadas por el organismo ejecutor de la ley en el 
intento de aiTesto. 

Se asume que se recolectan datos para una muestra de 
1 ,000 personas que han cometido un delito grave. Los datos 
revelan que, en promedio, los criminales comenten 12.4 
actos ilegales con una desviacion estandar de 4.7 antes de 
que sean arrestados o asesinados. Ademas, los datos 


EN ESCENA 


reportan que un promedio de 19.6 dias transcurren entre 
actos criminales, con una desviacion estandar de 1 1 .5 dfas. 
Ademas, 212 de los 1,000 criminales que aparecen en la 
base perdieron sus vidas intentando eludir a la policfa. 

Se asume ademas que se toma una muestra pequena de 
un tipo especffico de criminales. Quince observaciones de 
robo a mano armada reportan las siguientes cantidades, en 
miles de dolares, que se tomaron en los robos: 45.6, 23.8, 

45.3, 27.9, 54.3, 27.5, 63.4, 12.6, 75.9, 64.6, 54.7, 17.5, 

21.4, 56.4, y 34.9. 

Con base en estos datos y las herramientas aprendidas 
en este capitulo, proporcione un perfil de la actividad 
criminal a lo largo de la nacidn, tal como la que usted 
considera que un estadistico del FBI puede preparar. 
Seleccione y justifique sus propios niveles de confianza y 
calcule e interprete todos los intervalos de confianza. Haga 
comentarios sobre los tamanos muestrales. /,Son suficientes 
para lograr su objetivo? Especifique claramente que tamanos 
muestrales son necesarios para lograr el nivel de confianza 
y el error tolerable que usted requiere. Presente el informe 
final en forma de un reporte de negocios tal y como se 
describe en el apendice I. 


Del escenario a la vida real 

El sitio web del FBI ( www.fbi.gov ) proporciona estadfsticas sobre crimenes seleccionados, similares a las 
utilizadas en el analisis de la seccion Puesta en Escena. De la pagina de presentation (home page) del FBI, haga 
clic en “Publications”. Bajo el encabezado de Estadfsticas de Crimenes Uniformes, haga clic en “Final 19xx Crime 
Statistics” (datos completos de los anos mas recientes). Haga una lista de las categorias de estadfsticas sobre 
crimenes que esten disponibles en este sitio. 

Mire la informacion sobre robo con allanamiento de morada y sobre asaltos agravados. Note tanto el conteo 
de crimenes como la tasa por cada 100,000 para estas dos categorias. ^Que informacion se da sobre el incremento 
o reduction en el tipo de crimen sobre los datos del ano anterior? ^Estos datos son una muestra o un censo? ^Los 
datos disponibles proporcionan suficientes detalles para evaluar si el cambio proveniente del ano anterior es 
estadfsticamente significativo? Si no, ^que otra informacion adicional necesita para construir dicha prueba? 





Prueba 
de hipotesis 


Plan del capi'tulo 

Una hipotesis es una suposicion o inferencia sobre el valor desconocido de un parametro. Este capftulo anali7a 
como se pueden probar las hipdtesis y, por tanto, sacar algunas conclusiones sobre la poblacion. 
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E S C 

Durante los ultimos anos, el sistema bancario 
norteamericano ha pasado por una liberalization 
considerable. Gran parte de dicha liberalizacion ha venido 
sucediendo en forma de relajacion de las leyes que rigen el 
desempeno y las operaciones de los bancos comerciales y 
de otras instituciones financieras. First Bank of America 
acaba de fusionarse con Great Lakes National, un 
competidor mas pequeno del centro de los Estados Unidos, 
y la gerencia esta planeando varios cambios en las politicas 
que podrian afectar dramatic amente las operaciones 
bancarias ( Chicago Tribune, junio 5 de 1997). 

Lawrence Hopkins, gerente de la division de relaciones 
con los clientes, ha sido encargado de la responsabilidad de 
proporcionar estimaciones de muchos de los indicadores 
importantes de las actitudes de los clientes, respecto a estos 
cambios anticipados. Produce especial preocupacion la 
intention que tiene el banco de hacer que las tarifas y otros 


E N A R I 0 


costos se basen en el saldo promedio diario de la cuenta 
corriente del cliente. Debido a la fusion, el banco considera 
que su position en el mercado es lo suficientemente fuerte 
como para imponer un incremento en las tarifas sin provocar 
reacciones violentas de sus clientes. Los registros 
demuestran que los depdsitos promedio han ido 
incrementando y que First Bank ha ganado una participacion 
mayor en el mercado durante los ultimos dos anos, respecto 
a sus dos competidores mas grandes, Magna Bank y City 
National. Como lo indica la grafica, la participacion de 
First Bank en los depdsitos bancarios totales en el cuarto 
trimestre de 1998 (1998-IV) se estima en un 55%. 

Este capitulo analiza las herramientas que pueden 
utilizarse para preparar un informe que pueda ser benefico 
en muchas decisiones de las que First Bank debe tomar, en 
su esfuerzo por continuar con el exito y la prosperidad 
que ha gozado durante los ultimos anos. 
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8.1 Introduction 

El proposito del analisis estadistico es reducir el nivel de incertidumbre en el proceso de toma de decisiones. Los 
gerentes pueden tomar mejores decisiones solo si tienen suficiente informacion a su disposition. La prueba de 
hipotesis es una herramienta analitica muy efectiva para obtener esta valiosa informacion, bajo una gran variedad 
de circunstancias. Existen muchos ejemplos comunes en los negocios: 
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• Un embotellador de bebidas suaves debe determinar si el peso promedio del contenido de sus botellas es 16 
onzas (fi- 16 onzas). 

• Un productor de software de computador desea certificar que la proportion de sus productos que son 
defectuosos es menor del 3% ( k< 0.03). 

• Un fabricante de equipos deportivos desea saber si existe evidencia de que un proceso de produccion ha 
reducido los costos promedios de produccion por debajo de su nivel actual de US$5 por unidad (fi < 5). 

Las ilustraciones de esta naturaleza son virtualmente ilimitadas en un escenario de negocios. Si se pueden 
obtener respuestas a estas preguntas y a muchas otras con algun grado de garantia, la toma de decisiones se 
vuelve mas segura y es menos probable que conduzca a un error costoso. 


8.2 El concepto de prueba de hipotesis 

Para realizar una prueba de hipotesis, se hacen algunas inferencias o supuestos con sentido acerca de la poblacion. 
El embotellador de bebidas suaves citado anteriormente puede asumir, o plantear la hipotesis que el contenido 
promedio es de 16 onzas (fi = 16). Esta hipotesis nula (H Q : ) se prueba contra la hipotesis alternativa (H A :) que 
establece lo contrario. En este caso, el contenido promedio no es de 16 onzas (fi^ 16). Por tanto, se tendrfa que 

H {) : }jl = 16 H A : fx 16 

El termino nula implica nada o nulo. El termino surge de sus primeras aplicaciones por parte de los investigadores 
agrfcolas quienes probaron la efectividad de un nuevo fertilizante para determinar su impacto en la produccion de 
la cosecha. Asumieron que el fertilizante no hacfa ninguna diferencia en el rendimiento hasta que este produjo 
algun efecto. Por tanto, la hipotesis nula, tradicionalmente contiene alguna referenda de un signo con igual como 
“>”, “<”. Se analiza esta idea de forma mas completa en una discusion posterior de las pruebas de hipotesis 
de una cola. 

Con base en los datos muestrales, esta hipotesis nula es rechazada o no rechazada. Nunca se puede “aceptar” 
la hipotesis nula como verdadera. El no rechazo de la hipotesis nula solamente significa que la evidencia muestral 
no es lo suficientemente fuerte como para llevar a su rechazo. Incluso si T = 16, no prueba que fi = 16. Podrfa ser 
que fi sea 15.8 ( o cualquier otro numero), y debido al error de muestreo la media muestral acaba de igualar al valor 
de 16 que se plantea como hipotesis. Una analogia es que probar una hipotesis es como poner una persona en 
juicio. El acusado se halla o culpable o no culpable. Un veredicto de “inocente” nunca se considera. Un veredicto 
no culpable simplemente significa que la evidencia no es lo suficientemente fuerte como para encontrar culpable 
al acusado. No significa que el o ella sea inocente. 

Cuando se realiza una prueba de hipotesis, la hipotesis nula se supone que es “inocente” (verdadero) hasta 
que una preponderancia de la evidencia indique que es “culpable” (falso). Al igual que en un escenario legal, la 
evidencia de culpable debe establecerse mas alia de toda duda razonable. Antes que se rechace la hipotesis nula, 
la media muestral debe diferir significativamente de la media poblacional planteada como hipotesis. Es decir, que 
la evidencia debe ser muy con vincente y concluyente. Una conclusion con base en un rechazo de la hipotesis 
nula es mas significativa que una que termine en una decision de no rechazo. 

Se asume que se toma una muestra de n botellas y se halla una media de X = 16. 15 onzas. ^Se puede concluir 
que la media poblacional noes 16? Despues de todo, {16.15 no es 16! Probablemente no. Estapequena diferencia 
podrfa ser estadisticamente insignificante puesto que podrfa explicarse facilmente como un simple error de 
muestreo. Es decir, que debido al error de muestreo es posible tener una poblacion con una media de 16 y salir con 
una media muestral de I = 16.15. Debido al azar, algunas botellas de la muestra pueden estar algo mas llenas, 
produciendo una media muestral que sobrestime levemente la media poblacional. La evidencia muestral que X~ 
16.15 no es lo suficientemente fuerte como para desencadenar un rechazo de la hipotesis nula de que ft = 16. 
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Diferencia estadi'sticamente insignificante En la diferencia entre el valor de la 
media poblacional bajo la hipotesis y el valor de la media muestral que es lo 
suficientemente pequena como para atribuirla a un error de muestreo. 


Si la diferencia entre el valor de la media de 16 bajo la hipotesis y el hallado en la muestra de 16.15 es 
insuficiente para rechazar la hipotesis nula, el asunto entonces se vuelve simplemente que tan grande debe ser la 
diferencia para que sea estadisticamente significativa y conduzca un rechazo de la hipotesis nula. Vale la pena 
recordar de nuestra discusion sobre distribuciones de muestreo lo cual indica que se puede transformar toda 
unidad de medida, como las onzas del embotellador, hasta los valores correspondientes de Z con la formula Z: 

<T-x 

Vn 

Si cres desconocida, se utiliza la desviacion estandar muestral s. 

La distribution normal resultante de los valores de Z tiene una media de cero y una desviacion estandar de 
uno. La regia empfrica dice que el 95% de las.Y’s en la distribution de muestreo estan a 1 .96 errores estandar de la 
media poblacional desconocida, tal y como se muestra en la figura 8. 1 . 


Figura 8.1 ««: m = 16 

Valores criticos de Z 16 

y ZOnaS de rechazo si n = 16, existe solo un 2.5% Si // - 16, existe s61o un 2.5% de 

de oportunidad de que una media oportunidad de que una media muestral 

muestral produzca un valor Z < -1.96. produzca un valor Z > -1.96. 



| Zona de no rechazo 

Existe un 95% de probabilidad de 
que los resultados muestrales 
puedan caer entre ± 1.96 si la 
hipotesis nula es verdadera. 


A. Valores criticos de Z y zonas de rechazo 

Estos valores de Z de ± 1.96 son valores criticos que determinan las zonas de rechazo. Para hallarlos, divida por 
2 el 95%. En la tabla Z, el area de 0.95/2 = 0.4750 indica un valor Z de 1 .96. El 5% restante esta distribuido entre las 
dos colas, con 2.5% en cada zona de rechazo. Este 5% es el nivel de significancia, o el valor alfa de la prueba. 
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En la figura 8.1 vale la pena destacar que si la hipotesis del embotellador es correcta y /n = 16 onzas, es poco 
probable (solo un 5% de oportunidad) que una muestra cualquiera produzca un valor Z que caiga en cualquiera de 
las zonas de rechazo. Por tanto, si un valor de Z mayor que 1.96 o menor que -1.96 ocurre, no es probable que la 
distribucion este centrada en fi = 16, y la hipotesis nula serfa rechazada. 

Estos valores crfticos de Z de ± 1.96 permiten establecer una regia de decision que diga si se rechaza la 
hipotesis nula o no. La regia de decision es: 


Regia de decision: “No se rechaza la hipotesis nula si los valores Z estan entre ± 1 .96. Se rechaza 
si el valor Z es menor que -1 .96 o mayor que + 1 .96” 

La logica implicita en esta regia de decision, la cual se basa simplemente en las probabilidades, deberfa ser clara. 
Si la hipotesis nula es verdadera, no es probable que pueda resultar un valor de Z mayor que 1 .96 o menor que 
-1 .96. Solo 5% de todas las muestras en la distribucion muestral podrfan producir un valor de Z mayor que 1 .96 o 
menor que -1.96. Por tanto, si dicho valor Z ocurre, no es probable que jll = 16, y deberfa rechazarse la hipotesis 
nula. 


B. El nivel de significancia y la probabilidad de error 

A1 probar una hipotesis se pueden cometer dos tipos de errores. Un error tipo I es rechazar una hipotesis nula que 
es verdadera. En la figura 8.1, si la hipotesis del embotellador es verdadera y ju = 16, todavia hay un 5% de 
oportunidad de que una media muestral pueda caer en cualquier zona de rechazo, haciendo que se rechace de 
manera incorrecta la hipotesis nula. De todas las medias muestrales en la distribucion muestral, 2.5% produce un 
valor de 1 .96 en la zona de rechazo cola a la derecha y 2.5% produce un valor de Z < -1.96 en la zona de rechazo 
cola a la izquierda. Este 5% es el nivel de significancia , o valor alfa (valor a) y representa la probabilidad de un 
error tipo I. 


Error tipo I Rechazar una hipotesis verdadera. La probabilidad de cometer un error 
tipo I es igual al nivel de significancia, o valor cren el que se prueba la hipotesis. 


Un error tipo II es no rechazar una hipotesis nula que es falsa. Si la hipotesis nula H () : /u = 16 no es correcta, 
pero la prueba falla en detectarlo, se comete un error tipo II. Mientras que la probabilidad de un error tipo I es igual 
al valor a seleccionado, la probabilidad de un error tipo II, representado con la letra f3 , no se determina facilmente. 
No se puede asumir que a + /? = 1 . 

Los niveles de significancia, o valores a, comunmente seleccionados para pruebas de hipotesis son del 10%, 
5% y 1%. Sin embargo, al igual que con los intervalos de confianza no hay nada especial o magico sobre estos 
valores a. Se podria probar una hipotesis con un nivel de significancia del 4% si asi se decide. La selection de un 
valor a depende del tipo de error, tipo I o tipo II, que mas se desea evitar. Vale la pena recordar que el valor a de 
la prueba es la probabilidad de error tipo I. Si se rechaza una hipotesis verdadera (error tipo I) es mas serio que si 
no se rechaza una hipotesis falsa (error tipo II), se desearfa seleccionar un valor a bajo, como 1% o 5%, para 
minimizar la probabilidad de cometer un error tipo I. Por otra parte, si no rechazar una hipotesis falsa (error tipo II) 
es mas serio, en este caso es preferible un valor a mas alto como 10%. 

Se asume que el embotellador para bebidas suaves rechaza la hipotesis nula H Q \ (i- 16 y cierra el proceso de 
embotellado para ajustar el nivel del contenido. Sin embargo, si la media todavia es 16 onzas, el embotellador ha 
cometido un error tipo I. Si esto es mas costoso que un error tipo II, al permitir que continue el proceso cuando ju 
* 16, el embotellador desearfa seleccionar para la prueba un valor a bajo, tal como 1%. 
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8.3 Prueba de dos colas para n 

Ahora, esta preparado para realizar una prueba de hipotesis. Hay cuatro pasos involucrados en una prueba: 
Paso 1 : Plantear las hipotesis. 

Paso 2: Con base en los resultados de la muestra, calcular el valor del estadfstico de prueba Z. 

Paso 3: Determinar la regia de decision con base en los valores crfticos de Z. 

Paso 4: Interpretation y conclusiones. 

Se supone que el embotellador desea probar la hipotesis de que la media poblacional es 16 onzas y selecciona 
un nivel de significancia del 5%. Debido a que se plantea la hipotesis que /x = 16, la hipotesis nula y la altemativa 
son 

H 0 : ix = 16 
H a : n* 16 

Para probar la hipotesis, se calcula el estadfstico de prueba Z, y se compara con los valores crfticos de Z. 


El valor Zutilizado para probar 
la hipotesis euando ces eonocido 

2 _ X 

a 

Vn 

[8.1] 

en donde T es la media muestral 

j U H es el valor de la media poblacional bajo la hipotesis nula 

cr VW es el error estandar de la distribucion muestral, 

Cuando <res desconocida, se utiliza la desviacion estandar muestral y Zse vuelve 


El valor Zutilizado para probar 
la hipotesis cuando cres desconocida 

z = x 

[8.2] 


en donde s es la desviacion estandar muestral. 

Si el embotellador selecciona una muestra de n = 50 botellas con una media de X = 16.357 onzas y una 
desviacion estandar de s = 0.866 onzas, Zes 


16.357 - 16 
0.866 
V50 

= 2.91 

En la figura 8.2, el nivel de significancia del 5% se divide en dos colas. El 95% restante se divide por 2 para 
hallar el area de 0.4750. En la tabla Z esta area de 0.4750 da los valores crfticos de Zde ± 1.96. 

La regia de decision es: “No se rechaza la hipotesis nula si — 1 .96 < Z < 1 .96. Se rechaza si 
Z<-1.96oZ> 1.96”. 
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Figura 8.2 

Prueba de hipotesis 
para estimar el nivel 
promedio 
de contenido 


H 0 : /i = 16 
H a \ix* 16 


Si fn = 16, no es probable que 
resulte un Z > 1.96. Por tanto. 



Vale la pena destacar que las zonas de rechazo estan en ambas colas. Si Z> 1 .96 o Z < - 1 .96, se rechaza la hipotesis 
nula. Por este motivo se le denomina prueba de dos colas. 

El paso final en la prueba de hipotesis es donde cae el valor del estadistico para la muestra y determinar si la 
hipotesis nula debena rechazarse o no. El valor del estadistico para la muestra de 16.357 onzas produce una Z = 
2.91 > 1 .96 y cae en la zona de rechazo, cola a la derecha. Se pueden interpretar estos resultados como “la hipotesis 
nula es rechazada a un nivel de significance del 5%”. Simplemente no es probable que una poblacion con una 
media de 16 pueda dar una muestra que produzca una Z > 1.96. Hay solo un 2.5% de probabilidad que Z pueda 
exceder de 1 .96 (y solo un 2.5 % de probabilidad que Z < - 1 .96) si fi en realidad es 1 6. Por tanto, la hipotesis nula 
H 0 : fJL = 16 deberfa rechazarse a un nivel de significancia del 5%. 

^Esto significa que jll not s 16? No del todo. Si fi = 16, 2.5% de todas las muestras de tamano n = 50 todavia 
generarfa un Z > 1.96. La media poblacional podrfa ser 16, en cuyo caso se habra cometido un error tipo I 
rechazando H o . Pero esto no es probable debido a que P(Z > 1.96 I ju = 16) es solo 2.5%. 

La impresion en Minitab de la pantalla 8.1 proporciona los resultados de esta prueba. Asumiendo que se 
ingresan 50 observaciones en la columna 1, simplemente haga clic en STAT > Basic Statistics > 1-Sample Z, e 
ingrese 16 para Test Mean y la desviacion estandar para los datos muestrales de 0.866. Vale la pena notar que la 
media muestral, la desviacion estandar y el valor Z de 2.91 estan dados. Se discutira mas tarde la importancia del 
valor p. 


Pantalla 8.1 

Z-Test (Prueba Z) 

Test of mu = 16.000 vs mu not = 16.000 (Prueba de mu = 16.000 contra no mu = 16.000) 
The assumed sigma (sigma asumido) = 0.866 


Variable 

N Mean 

StDev 

SE Mean 

z P-Value 


(Media) 

(Desviacion estandar) 

(Media SE) 

(Valor P) 

Ounces (onzas) 

50 16.357 

0.866 

0.122 

2.91 0.0037 


Ejemplo 8.1 

Como se explico en la seccion “ Escenario”, a comienzos de este capitulo, la gerencia de First Bank 
of America esta planeando basar los cargos para las cuentas corrientes en el saldo diario promedio. 
El gerente de cuentas preferenciales desea probar la hipotesis de que las cuentas tienen un promedio 
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de US$312. Se selecciona una muestra de 200 cuentas, dando una media de US$298.10 con s = 
US$97.30. Para minimizar la probabilidad de un error tipo I, se selecciona un valor ade 1%. (Tenga 
en cuenta los cuatro pasos al realizar la prueba). 


Solucion 

Las hipotesis nula y la altemativa son 

H 0 : jx = 312 
H a : jx i=- 312 

Z es 


2 — X ~~ _ 298.10 - 312 _ __ 2Q2 

97.30 

Vn V200 

Como lo muestra la figura, un a= 0.01 requiere valores crfticos de Z de ± 2.58. El 0.01 esta dividido 
de manera homogenea en dos zonas de rechazo, dejando un area de 0.4950 que corresponde a los 
valores crfticos de Z de ± 2.58 



Zona de no rechazo 


Regia de decision: No rechazar H o si -2.58 < Z < + 2.58. Rechazar H o si Z < -2.58 
oZ>2.58. 

Si la hipotesis nula es verdadera, existe solo un 1% de probabilidad que una muestra pueda resultar 
en un valor Z menor que -2.58 o mayor que 2.58. Por tanto, si Z cae en cualquiera de las colas, no es 
probable que ji = 3 12, y la hipotesis nula deberfa rechazarse. El valor Z = -2.02 esta en la zona de no 
rechazo. 

Interpretacion 

La diferencia entre el valor de la media poblacional bajo la hipotesis nula de US$3 12 y el valor de la 
media muestral de US$298.10 es estadisticamente insignificante. Podrfa resultar simplemente del 
error de muestreo. De hecho si }i = US$312; el 99% de todas las muestras de tamano n = 200 
producirfan valores Z entre ± 2.58. Por tanto, no se espera un valor de -2.02. 


Ejercicios de la seccion 


1. ^Cuales son los cuatro pasos de una prueba de hipotesis? 
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2 . Explique con sus propias palabras por que la regia de decision tiene que utilizarse para determinar si la 
hipotesis nula deberfa rechazarse. ^Cual es el papel de la probabilidad en esta decision? 

3. ^Que se entiende por una “diferencia insignificante” entre la media poblacional de la hipotesis y la media 
muestral? 

4 . ^Por que nunca se “acepta” la hipotesis nula como cierta? 

5. ^Que papel desempenan lo£ valores criticos de Z en el proceso de prueba? ^Como se determinan? Haga una 
grafica en su respuesta. 

6. ^Cual es el “nivel de significancia” en una prueba? ^Como influye en los valores cnticos de Z? Haga una 
grafica en su respuesta. 

7. Diferencie entre el error tipo 1 y el error tipo II. De un ejemplo. 

8. Utilizando una grafica, ilustre de manera clara como la probabilidad de un error tipo I es igual al nivel de 
significancia (valor a) de una prueba. 

9. Si un error tipo II es considerado mas serio en cierta situation, ^seleccionaria usted un valor a alto o bajo? 
Explique. 

10 . Como gerente de compras para una gran empresa de seguros usted debe decidir si actualizar o no los 
computadores de la oficina. A usted se le ha dicho que el costo promedio de los computadores es de 
US$2, 100. Una muestra de 64 minoristas re vela un precio promedio de US$2,25 1 , con una desviacion estandar 
de US$812. iA un nivel de significancia del 5% parece que su information es correcta? 

11 . Seducido por los comerciales, usted ha sido persuadido para comprar un nuevo automovil. Usted piensa que 
tendra que pagar US$25,000 por el auto que usted desea. Como comprador cuidadoso, averigua el precio de 
40 posibles vehfculos y encuentra un costo promedio de US$27,3 12, con una desviacion estandar de US$8,01 2. 
Deseando evitar un error tipo II, usted prueba la hipotesis de que el precio promedio es US$25,000 con un 
nivel de significancia del 10%. ^Cual es su conclusion? 

12 . Debido al tiempo excesivo que se gasta hacia el sitio de trabajo, la oficina en donde usted trabaja en el centro 
de Chicago esta considerando espaciar las horas de trabajo para sus empleados. El gerente considera que los 
empleados gastan un promedio de 50 minutos para llegar al trabajo. Setenta empleados se toman en promedio 
47.2 minutos con una desviacion estandar de 18.9 minutos. Fije a en 1% y pruebe la hipotesis. 

13 . En 1 997 la empresa de inversiones de Goldman Sachs informo que los norteamericanos invierten un promedio 
de US$18,600,000 cada mes en el mercado de titulos. ^Esta afirmacion esta apoyada a un nivel de significancia 
del 5% si una muestra de 36 meses tiene una media de US$17,100,000 y una desviacion estandar de 
US$2,400,000? 

14 . Cuando venian de regreso de las minas a la casa los siete enanos le dicen a Blancanieves que excavaron un 
promedio semanal de 12 toneladas de oro. Pero sin estar dispuesta a creer esta afirmacion sin prueba alguna, 
la senorita Nieves recolecta datos durante 49 semanas y descubre una media de 1 1 .5 toneladas y una desviacion 
estandar de 1.1 toneladas. un nivel del 10% parece que los enanos estan en lo cierto? 

15 . Antes de publicar un nuevo libro de cocina, Bantam Books desea probar la hipotesis, con un nivel de 
significancia del 2% de que el precio promedio de tales libros es de US$35.00. ^Esta afirmacion se sustenta si 
una muestra de 50 libros de cocina tiene una media de US$32.97 y una desviacion estandar de US$12.87? 

16 . El supermercado local gasto remodelando miles de dolares durante muchas semanas. Aunque la interruption 
espanto a los clientes temporalmente, el gerente espera que los clientes vuelvan a disfrutar de las nuevas 
comodidades. Antes de remodelar, los recibos de la tienda promediaban US$32,533 por semana. Ahora que se 
ha terminado la remodelacion, el gerente toma una muestra de 36 semanas para ver si la construction afecto 
de alguna manera el negocio. Se reporto una media de US$34,166 y una desviacion estandar de US$12,955. 
^Que puede decidir el gerente a un nivel de significancia del 1%? 
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8.4 Pruebas de una cola para \i 

Las pruebas realizadas anteriormente eran pruebas de dos colas debido a que habia zonas de rechazo en ambas 
colas. Como lo muestra la figura 8.3 a), la prueba de hipotesis de la embotelladora de que // = 1 6 se rechazana si el 
valor del estadistico para la muestra es o demasiado alto o demasiado bajo. De cualquier forma, parece que u no 
es 16 y la hipotesis nula se rechaza. 

Sin embargo, hay ocasiones en las que se esta interesado solo en un extremo u otro. Un restaurante de comida 
fresca de mar en Kansas City no se interesa en que tan rapido llegan las langostas provenientes de la costa este. 
Se preocupa solo en si el envfo se toma mucho tiempo en llegar. Una tienda minorista se alarmara solo si los 
ingresos caen a niveles demasiado bajos. En particular, las ventas altas no son problema. En cada uno de estos 
casos la preocupacion se concentra en un extremo u otro y se realiza una prueba de una cola. 


Figura 8.3 

Comparacion 
de las pruebas 
de dos colas 
y de una cola 


(<?) H f) : fx = 16 


Una prueba de dos colas 
tiene una zona de rechazo 



(■ b ) H {) : fi > 16 

fx < 16 ^ na P me ba de cola a 



(c) H (i : fi < 16 Una prueba de cola a la derecha 
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En lugar de plantear la hipotesis de que el nivel de contenido promedio sea exactamente 16 onzas, se supone 
que el embotellador considera que el nivel de contenido promedio esta “por lo menos en 16 onzas”. La hipotesis 
nula se convierte H 0 : fi > 16; es decir, 16 o mas. La hipotesis altemativa se plantea al contrario, y todo el conjunto 
de hipotesis es 

H 0 : ix s 16 H a : il < 16 

La figura 8.3 b) muestra que la hipotesis H Q : ji > 16 no se rechaza si el valor del estadistico para la muestra esta por 
encimade 16. La hipotesis H 0 : fi> 16permite valorespor encimade 16. Las medias muestrales tales como 16.3 o 
16.5 oincluso 17 y 18 sustentan, norefutan, la afirmacion que Solo los valores que estan significativamente 

por debajo de 16 pueden causar un rechazo de la hipotesis nula. Por tanto, una zona de rechazo aparece solamente 
en la cola izquierda y el monto total del valor a se coloca en esta zona unica de rechazo. 

Se asume que el embotellador dice que el nivel de contenido promedio “es a lo mas 1 6”. La hipotesis nula ahora 
se escribe como H Q : p < 16. Las hipotesis son 

H 0 : jx < 16 H a : jjl > 16 

La figura 8.3 c ) muestra que ahora los valores bajos para el valor del estadistico de la muestra no terminan en un 
rechazo. La hipotesis nula H 0 : p < 16 permite valores por debajo de 16. Las medias muestrales tales como 15, o 
incluso 14, sustentan la afirmacion de que p < 16. Solo los valores que estan significativamente por encima de 16 
causaran un rechazo. Por tanto, hay una zona de rechazo solo en la cola derecha y el valor total para a se coloca 
en esta unica zona de rechazo. 

Vale la pena destacar que tanto en la prueba de cola a la izquierda como en la prueba de cola a la derecha, el 
signo igual se coloca en la hipotesis nula. Esto es porque la hipotesis nula se esta probando a un valor a 
especifico (como 5%) y el signo igual da a la hipotesis nula un valor especifico (como 16) para probarla. El ejemplo 
8.2 ilustra una prueba de una cola. 


Ejemplo 8.2 

En una reunion informativa para una oficina corporativa, el gerente del hotel Embassy Suites en 
Atlanta, reporto que el numero promedio de habitaciones alquiladas por noche es de por lo meilOS 
212. Es decir, fi> 212. Uno de los funcionarios corporativos considera que esta cifra puede estar 
algo sobrestimada. Una muestra de 150 noches produce una media de 201.3 habitaciones y una 
desviacion estandar de 45.5 habitaciones. Si estos resultados sugieren que el gerente ha “inflado” 
su reporte, sera amonestado severamente. A un nivel de 1%, ^cual es el destino del gerente? 

Solucion 

La afirmacion del gerente que /x > 212 contiene el signo igual y por tanto sirve como la hipotesis 
nula: 


H 0 : ii > 212 H a : ix < 212 
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Los valores por encima de 212 no provocaran un rechazo de la hipotesis nula, la cual permite ver 
claramente los valores superiores a 212. Solo los valores que estan significativamente por debajo 
de 212 conduciran a un rechazo de ji >212. Por tanto, esta es una prueba de cola a la izquierda. Z es 


201.3 - 212 
45.5 
VI50 


- 2.88 


Como lo muestra la figura, un nivel de significance del 1% deja un area de 0.4900 que, de la tabla Z, 
requiere un valor crftico Z de - 2.33. 


La regia de decision es: “No rechazar H o si Z> -2.33. Rechazar H o si Z < -2.33”. 

El valor Z de -2.88 esta claramente en la zona de rechazo. La hipotesis nula H 0 : |i> 212 no se 
confirma. 


Interpretacion 

Parece que el gerente se ha excedido al estimar su tasa de ocupacion y aparentemente recibira una 
reprimenda de la oficina principal. 


Se considera la siguiente prueba de cola a la derecha. 


Ejemplo 8.3 

Una encuesta realizada por la Asociacion Nacional de Estudiantes Colegiados ( National Collegiate 
Students' Association) mostro que los estudiantes de las universidades de la nation gastan en 
promedio mas de US$75 mensuales en entretenimiento. Si usted puede hallar evidencias para 
confirmar esta afirmacion, podria utilizarla para solicitar a su casa ayuda monetaria adicional. De los 
100 estudiantes que tomo de muestra, usted halla una media de US$80.23 con una desviacion 
estandar de US$45.67. un nivel de signiflcancia del 2%, se encuentra justification para la 
solicitud? 


Solution 


La afirmacion de que la media es mas de US$75.00 sirve como hipotesis altemativa debido a que 
^ > 75 no contiene el signo igual. Las hipotesis son entonces 

H 0 : 1*^15 H a \ gL > 15 

y se requiere una prueba de cola a la derecha debido a que los valores mas bajos no terminarfan en 
un rechazo de la hipotesis nula. Entonces, 


80.23 - 75 
45.67 
VlOO 


1.15 



0 


1.15 


2.05 


Z 
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El area que se muestra en la figura de 0.4800 indica un valor crftico de Z de 2.05. 

La regia de decision es: “No rechazar H o si Z < 2.05. Rechazar H q si Z > 2.05”. 


Debido a que Z = 1 . 15 < 2.05, no se rechaza la hipotesis nula H Q : jlx < 75. Parece que el costo promedio 
de entretenimientomo es superior a US$75. 

Interpretacion 

A pesar de su estilo de vida decadente, el estudiante tfpico no gasta mas de US$75. Tendra que 
encontrar otra forma para obtener mas dinero de casa. 


Ejercicios de la seccion 


17 . Explique con sus propias palabras la diferencia entre pruebas de hipotesis de una cola y de dos colas. De ejemplos de 
ambas. 

18 . ^Por que el signo igual siempre va a la hipotesis nula? 

19 . Explique claramente <’,por que una hipotesis nula de H () : m £ 10 requiere una prueba de cola a la derecha, mientras que una 
hipotesis nula de H 0 : fi > 10 requiere una prueba de cola a la izquierda? 

20 . Durante los ultimos meses Raynor & Sons ha publicitado ampliamente su negocio de suministros electricos. El Sr. Raynor 
espera que el resultado haya sido incrementar las ventas promedio semanales por encima de US$7,880 que la compama 
experimento en el pasado. Una muestra de 36 semanas da una media de US$8,023 con una desviacion estandar de 
US$1,733. A un nivel de significancia del 1%, ^parece que la publicidad ha producido efecto? 

21 . En otono de 1997, Hardee’s, el gigante en comidas rapidas, fue adquirido por una compama de California que planea 
eliminar del menu la linea de polio frito. La afirmacion era que los ingresos recientes habian descendido por debajo de la 
media de US$4,500 que habian presentado en el pasado. £ Parece esta una sabia decision si 144 observaciones revelan una 
media de US$4,477 y una desviacion estandar de US$1 ,228? La gerencia esta dispuesta a aceptar una probabilidad del 2% 
si comete un error tipo I. 

22 . Segun The Wall Street Journal (mayo 12 de 1997) muchas compamas de ropa deportiva estan tratando de comercializar 
sus productos entre los mas jovenes. El artfculo sugirio que la edad promedio de los consumidores habfa caido por debajo 
del grupo de edad de 34.4 anos que caracterizo los comienzos de la decada. Si una muestra de 1,000 clientes reporta una 
media de 33.2 anos y una desviacion estandar de 9.4, £que se concluye a un nivel de significancia del 4%? 

23 . La emision de julio de 1997 de la revista Forbes informo sobre los “escondites” exclusivos en la parte norte de New York 
State y sus alrededores utilizados por los ejecutivos ricos para escapar del tedio de sus estresantes vidas diarias. El costo 
es muy razonable, informo el artfculo. Usted puede contratar alojamientos de fin de semana por menos de US$3,500. ^Se 
confirma esta cifra “razonable” a un nivel de significancia del 5% si una muestra de 60 centros turfsticos tienen un costo 
promedio de US$3,200 y 5 = US$950? 

24 . A comienzos de los anos 90, Hyundai, el fabricante coreano de automoviles, sufrio una severa cafda en las ventas, por 
debajo de su pico mensual de 25,000 unidades de mayo de 1988. Hyundai Motor America (verano de 1997) reporto que 
las ventas habian bajado a menos de 10,000 unidades. Durante un perfodo de 48 meses que comenzo en enero de 1990, las 
ventas promedio fueron de 9,204 unidades. Se asume una desviacion estandar de 944 unidades. i A un nivel del 1% de 
significancia, parece que el numero promedio de unidades ha caido por debajo de la marca de 10,000? 

25 . Baskin-Robbins, la franquicia de helados, afirma que el numero de tiendas que se abre ha incrementado por encima del 
promedio semanal de 10.4 experimentado en tiempos de escasez {The Wall Street Journal febrero de 1997). ^Existe 
alguna evidencia para sustentar esta afirmacion si 50 semanas muestran una media de 12.5 y una desviacion estandar de 
0.66 tiendas? La gerencia esta dispuesta a aceptar una probabilidad del 4% de rechazo de la hipotesis nula si esta es cierta. 

26 . Una publicidad reciente afirma que el monto del seguro de bienes y del seguro marftimo estipulado por Atlantic Mutual 
es de por lo menos US$325,500 por mes. Cuarenta meses reportan una media de US$330,000 y s = US$1 12,300. i A un 
nivel de significancia del 5%, la afirmacion de Atlantic Mutual parece ser valida? 
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8.5 Valores p\ Uso e interpretation 

Como se ha visto, para probar una hipotesis se calcula un valor Z y se compara con un valor crftico Z con base en 
el nivel de significancia seleccionado. Mientras que el valor p de una prueba puede servir como metodo altemativo 
para probar hipotesis, en realidad es mucho mas que eso. 

En esta section se desarrolla una definition estricta del valor p y el papel que puede jugar en la prueba de 
hipotesis. Se deberia entender completamente por que el valor p y puede definirse de la forma como que esta 
definida. Tambien se explica como calcular el valor p, tanto para pruebas de dos colas como para pruebas de una 
cola. 

El valor p para una prueba es la probabilidad de obtener resultados muestrales al menos tan extremos como los 
que se obtuvieron dado que la hipotesis nula es verdadera. Se encuentra de la misma manera que el area de la cola 
que va mas alia del valor del estadistico para la muestra. Comenzando con una prueba de una cola, se tiene que 
Chuck Cash es el jefe de personal. A partir de un breve analisis de los registros de los empleados. Chuck considera 
que los empleados tienen un promedio de mas de US$31,000 en sus cuentas de pensiones (p > 31,000). Al tomar 
como muestra 1 00 empleados. Chuck encuentra una media de $3 1 ,366, con s = US$ 1 ,894. 

Se supone que Chuck desea calcular el valor p relacionado con esta prueba de cola a la derecha. Las hipotesis 
son: 

H 0 : p < 31,000 H a : p > 31,000 

Z es 


Figura 8.4 

Prueba de hipotesis 
de una cola, para 
el caso de Chuck 



(a) H () : ,000 



0 1.93 2 



0 1.65 1.93 Z 

1 • 


(<’) si a es menor que 0.0268, i i 
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El valorp es el drea de la cola que esta mas alia del valor del estadi'stico para la muestra de Z= 1 .93. Como lo ilustra 
la figura 8.4 A), un valor Z = 1 .93 da un area de 0.4732. El valor p, el area que esta en la cola que va mas alia del valor 
del estadi'stico para la muestra de 1 .93, es 0.5000 - 0.4732 = 0.0268, o 2.68% 


Valor p Es el nivel mas bajo de significance (valor a) al cual se puede rechazar la 
hipotesis nula. Es el area en la cola que esta mas alia del valor del estadi'stico para la 
muestra. 


/.Exactamente que le dice este valor/7 del 2.68% a Chuck? El valor p se define como el nivel de significance mas 
bajo (valor alfa mi'nimo) que puede determinarse y sin embargo rechazar la hipotesis nula. Por ejemplo, la figura 8.4 
B) muestra que si se fija aen un valor mayor que 0.0268, como 0.05, el area de 0.4500 requiere un valor crftico Z de 
1 .65. Por tanto, el valor del estadi'stico para la muestra de Z = 1 .93 cae en la zona de rechazo. Por otra parte, como 
lo revela la figura 8.4 C ), si se selecciona un valor a menor que 0.0268, como 0.01, el area resultante de 0.4900 
especifica un valor critico de Z de 2.33 y el valor del estadi'stico para la muestra de Z = 1 .93 cae en la zona de no 
rechazo. Por tanto, Chuck puede bajar el valor a para la prueba hasta 0.0268 sin colocar el valor del estadi'stico para 
la muestra en la zona de no rechazo. Es decir, un valor a de 0.0268 es el valor a mas bajo que Chuck puede fijar y 
sin embargo rechazar la hipotesis nula. 

El valor p dice a Chuck a que decision llegara en cualquier valor a seleccionado. Sencillamente, si el valor p es 
menor que el valor a, se rechazara la hipotesis nula. 

La pantalla 8.2 en Minitab proporciona la impresion para la prueba de una cola que hace Chuck. El valor Zy el 
valor p que Chuck calculo pueden obtenerse facilmente haciendo clic en Stat > Basic Statistics > 1-Sample Z. Se 
fija el nivel de confianza y se ingresa el valor que se planted en la hipotesis nula para estimar la media. Se 
selecciona greater than (mayor que) para la hipotesis altemativa. Finalmente, se ingresa 1894 para sigma. 


Pantalla 8.2 

Z-Test (Prueba Z) 

Test of mu = 31000 vs mu > 31000 (Prueba de mu = 31000 contra mu > 31000) 

The assumed sigma (sigma asumido) = 1894 

Variable N Mean StDev SE Mean Z P-Value 

(Media) (Desviacidn estdndar) (Media SE) (Valor P) 

Amount (Cantidad) 100 31366 1894 189 1.93 0.0268 

Cuidado! Muchos programas de computador reportan solo valores p para pruebas de dos colas. Si se esta 
realizando una prueba de una cola, divida por 2 el valor p reportado para obtener el valor de una cola. Sin embargo, 
si se siguen las instrucciones anteriores. Minitab proporcionara el valor de una cola. 


A. Valor p para una prueba de dos colas 

Calcular el valor/? de una prueba de dos colas es muy similar, con un leve giro al final. Se asume que Chuck tambien 
sospecha que los empleados invierten un promedio de US$100 mensuales en el plan de opcion de compra de 
acciones de la compama (// = 100). Al tomar como muestra 100 empleados, Chuck descubre una media de US$ 106.8 1 
con una desviacion estandar de US$36.60. Ahora desea determinar el valor p relacionado con la prueba de 
hipotesis 


H 0 : ii = 100 


H a : /A # 100 
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Zes 


106.81 - 100 
36.60 
VTOO 


1.86 


Para calcular el valor p, Chuck determina el area en la cola que va mas alia del valor del estadfstico para la 
muestra de Z = 1.86. En la figura 8.5 esta area es 0.0314. A diferencia de una prueba de una cola, esta area debe 
multiplicarse por 2 para obtener el valor p. Esto es necesario porque en una prueba de dos colas el valor a se 
divide en las dos zonas de rechazo. El valor p es 0.03 14 X 2 = 0.0628. Vale la pena recordar que el valor p es el valor 
a mas bajo al cual se rechaza la hipotesis nula. Si se fija el valor aen menos que el valor p, la hipotesis nula no es 
rechazada. 


Figura 8.5 

Prueba de la 
hipotesis de dos 
colas para el caso 
de Chuck 



La pantalla 8.3 en Minitab muestra los resultados de la prueba de dos colas que realizo Chuck. Vale la pena 
destacar que el valor p de 0.063 es para una hipotesis de dos colas y no es necesario multiplicar por dos. 


Pantalla 8.3 


Z-Test (Prueba Z) 

Test of mu = 100. 

00 vs mu not = 100.00 (Prueba de mu = 

100.00 contra no mu 

= 100.00) 

The assumed sigma 

(sigma 

asumido) 

= 36.6 



Variable 

N 

Mean 

(Media) 

StDev 

(Desviacion estandar) 

SE Mean Z 

(Media SE) 

P -Value 

(Valor P) 

Dollars (Dolares) 

100 

106.81 

36.60 

3.66 1.86 

0.063 


Ejemplo 8.4 

En mayo de 1997, el Congreso aprobo un presupuesto federal que contenia varias partidas para 
recortes tributaries. Los analistas afirmaron que ahorrarfa al contribuyente, en promedio US$800 
por ano. Calcule e interprete el valor p si una muestra de 500 contribuyentes presenta un ahorro 
promedio de US$785.10 con una desviacion estandar de US$187.33. 


Solucion 

H 0 : p = 800 H a \ p 800 


Z es 


785.10 - 800 
187.33 


-1.78 


V500 
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El valor p se determina hallando el area que esta mas alia del valor del estadistico para la muestra de 
- 1 .78, como lo muestra la figura, 0.5000 - 0.4625 = 0.0375. Entonces, 0.0375 X 2 = 0.0750 = valor p. 



Interpretacion 

El valor p muestra que el valor a mas bajo que pueda fijarse y sin embargo rechazar la hipotesis nula 
es de 7.5%. Es por esto que no se rechaza a un valor a del 5 %. 


Ejercicios de la seccion 


27 . Defina el valor p relacionado con una prueba de hipotesis. Utilice una grafica para explicar claramente ^por 
que el valor p se define de esta manera y como puede utilizarse para probar una hipotesis? Hagalo tanto para 
una prueba de una cola como para una prueba de dos colas. 

28 . En el verano de 1997, el Congreso aprobo un presupuesto federal que contenfa varias partidas para reducciones 
de impuestos. Los analistas afirmaron que ahorrarfa al contribuyente promedio US$800. Una muestra de 500 
contribuyentes demostro una reduction promedio en los impuestos de US$785.10 con una desviacion estandar 
de US$277.70. Pruebe la hipotesis a un nivel de significancia del 5%. Calcule e interprete el valor p. 

29 . Utilizando los datos del problema anterior, compare el valor aeon el valor p que usted calculo, y explique por 
que rechazo o no rechazo la hipotesis nula. Utilice una grafica en su respuesta. 

30 . A comienzos de los anos 90 Sony Corporation introdujo su PlayStation de 32 bits en el mercado de los juegos 
de video. La gerencia esperaba que el nuevo producto incrementara las ventas mensuales en Estados Unidos 
por encima de los US$283,000,000 que Sony habia experimentado en la decada anterior. Una muestra de 40 
meses reporto una media de US$297,000,000. Se asume una desviacion estandar de US$97,000,000. Pruebe la 
hipotesis a un nivel de significancia del 1%. Calcule e interprete el valor p. 

31 . En otono de 1996 Joe Galli, presidente de Black and Decker (B&D) potencia mundial en electrodomesticos, 
asistio a una convention en la Arena Kemper en Kansas City y anuncio a quienes estaban presentes que las 
ventas de B&D habfan alcanzado un nuevo pico de US$7,700,000 por semana durante la decada actual 
C Forbes , septiembre de 1996). ^La afirmacion de Galli es confirmada a un nivel de significancia del 1% si dos 
anos de datos dan una media de US$8,200,000 y s = US$1 .800.000? <?,Cual es el nivel mas bajo de significancia 
que Galli puede fijar y sin embargo rechazar la hipotesis nula? 

32 . Forbes (septiembre de 1996) reporto que Freddie McMann, representante de la cantante de pop Madonna, 
estimo que las ventas diarias de su nuevo album excederfa las de su exito mas grande de 1994, Like a Virgin 
(Como una Virgen), el cual tuvo un promedio de ventas de 27,400 copias. ^Freddie esta en lo cierto a un nivel 
de significancia del 10% si 50 observaciones (dlas) poseen una media de 28,788 copias con una desviacion 
estandar de 3,776? Calcule e interprete el valor p. 


8.6 Pruebas para p, muestras pequenas 

Al igual que con los intervalos de confianza, si la muestra es pequena, aes desconocida, y la poblacion es normal 
o casi normal en cuanto a su distribucion, puede utilizarse la distribucion t. Los estudiantes en una clase de 
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estadfstica en State University ctiestionan la afirmacion de que McDonald’s coloca 0.25 libras de came en sus 
“hamburguesas de cuarto de libra”. Algunos estudiantes argumentan que en realidad se utiliza mas, mientras que 
otros insisten que es menos. Para probar la afirmacion publicitaria que el peso promedio es de 0.25 libras, cada 
estudiante compra una hamburguesa de cuarto y la lleva a clase, en donde la pesan en una balanza suministrada 
por el instructor. Los resultados de la muestra son 0.22 libras y s = 0.09. Si hay 25 estudiantes en clase, ^a que 
conclusiones llegarfan a un nivel de significancia del 5%? Las hipotesis son 

H 0 : /x = 0.25 H a : /x # 0.25 
Debido a que n < 30, t se calcula como 


Prueba para la media 
(muestras pequenas) 


t = ^ i 

s 

V~n 


[8.3] 


Dados los datos actuates, se halla 


0.22 - 0.25 
0.09 
V25 


1.667 


El valor t de 1 .667 se compara con un valor cntico de t con n - 1 = 24 grados de libertad y un valor a del 5%. De la 
tabla t para prueba de dos colas , 1 05 24 = 2.064. La regia de decision como se refleja en la figura 8.6 es: 


Regia de decision: “No rechazar H o si t esta entre ± 2.064. Rechazar H o si t es menor que -2.064 
o mayor que + 2.064” 


Figura 8.6 

Prueba t de dos 
colas para la 
media poblacional 



Debido a que t = 1.667 esta entre ± 2.064, no se rechaza la hipotesis nula. La evidencia de prueba confirma la 
afirmacion de McDonald’s de que las hamburguesas de cuarto de libra contienen efectivamente 0.25 libras de 
came. 

Como se puede esperar, una prueba de una cola es similar, pero con una leve alteracion. Cuando se utiliza la 
tabla f se deben utilizar valores para pruebas de una cola. The American Kennel Club ( AKC) reporto en su 
publicacion Estadounidenses Propietarios de Perros ( American Dog Owners) (abril de 1997) que los perros 
cocker spaniels de un ano de edad debenan pesar “un poco mas de 40 libras (p > 40) si han recibido una nutricion 
apropiada”. Para probar la hipotesis 

H 0 : /x < 40 H a : /x > 40 

Hill’s, productor de alimentos para la dieta de los perros, pesa 15 perros cokers de un ano de edad y descubre una 
media de 41 . 17 libras, con s = 4.71 libras. Seleccionando una probabilidad del 1 % de cometer un error tipo I se tiene 
que 
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41.17 - 40 
4 771 
vTs 


0.96 


De la tabla t para pruebas de una cola, 1 0 01 14 = 2.624. La regia de decision como se muestra en la figura 8.7 es: 


Regia de decision: “No rechazar si t < 2.624. Rechazarla si t > 2.624”. 


Figura 8.7 

Prueba t de una 
cola para la media 
poblacional 



El valor t de 0.96 cae claramente en la zona de no rechazo. La hipotesis nula H 0 : \x < 40 no se rechaza. La evidencia 
de la muestra sugiere que no se confirma la afirmacion de AKC. 

La pantalla 8.4 en Minitab muestra los resultados de la prueba para la hipotesis sobre los perros cocker 
spaniel. El valor t es 0.96 junto con el valor p de 0.18 > 0.01 . Calcular el valor p de una tabla t requiere de mas 
conjeturas que utilizar una tabla Z, porque la tabla t esta menos detallada. No intente hacer calculos manuales de 
los valores p para muestras pequehas, confie estrictamente en el computador para hallar esta information. 


Pantalla 8.4 

T-Test of the Mean (Prueba T de la media) 

Test of mu = 40.00 vs mu > 40.00 (Prueba de mu = 40.00 contra mu > 40.00) 


Variable 

N 

Mean 

St Dev 

SE Mean 

T P-Value 



(Media) 

(Desviacion estandar) 

(Media SE) 

(Valor P) 

Weight (Peso) 

15 

41.17 

4.71 

1.22 

0.96 0.18 


Ejercicios de la seccion 


33. Un distributor de bebidas plantea la hipotesis de que las ventas por mes promedian US$12,000. Diez meses 
seleccionados como muestra reportan una media de US$11 ,277 y una desviacidn estandar de US$3,772. Si se 
utiliza un valor a del 5%, ^que puede concluir acerca de la impresion que tiene el distributor sobre las 
condiciones del negocio? 

34. Los registros llevados por una gran tienda por departamentos indican que en el pasado las ventas semanales 
tenian un promedio de US$5,775. Para incrementar las ventas, la tienda comenzo recientemente una campana 
agresiva de publicidad. Despues de 15 semanas, las ventas promediaron US$6,012 con 5 = US$977. ^La tienda 
debena seguir con el programa publicitario? Fije aen 1% . 

35. Stan and Ollie venden helado en un carrito movil en el Central Park de Nueva York. Stan le dice a Ollie que 
venden un promedio de por lo menos 15 libras de helado de vainilla cuando la temperatura supera los 80 
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grados. Ollie no esta de acuerdo. Si 20 dias de 80 grados o mas revelan un promedio de 13.9 libras y s = 2.3 
libras, ^quien esta en lo correeto, Ollie o Stan? Fije aal 5%. 

36 . Un nuevo bombillo producido por Sun Systems esta disenado para incrementar la vida util de los bombillos 
a mas de 5,000 horas que es el promedio de los que actualmente existen. ^E1 nuevo producto de Sun 
Systems proporciona una mejora si 25 bombillos se funden en promedio a las 5,117 horas con s = 1,886 
horas? Fije aen 5%. 

37 . Una empresa de servicio postal garantiza a su empresa que puede reducir el tiempo promedio necesario para 
recibir un paquete a menos de 2.5 dias que es lo que usted experimenta actualmente. Despues de utilizar la 
nueva compama en 17 ocasiones, el tiempo de entrega promedio fue de 2.2 dias y la desviacion estandar fue 
de 0.9 dias. ^Deberia cambiar su firma a la nueva empresa de mensajerfa? Sea aigual a 1%. 

38 . Como supervisor de production, es su responsabilidad garantizar que las bolsas de semilla de pasto que 
vende su firma pesen en promedio 25 libras. Urgido por la preocupacion de que esta especificacion del peso 
no se cumpla, usted selecciona 25 bolsas y encuentra una media de 23.8 libras con una desviacion estandar 
de 6.6 libras. ^Deberia ordenar que la lfnea de ensamble se cierre y se hagan los ajustes en el proceso de 
llenado? Para minimizar un error tipo I, escoja un valor a de 1 %. 

39 . Usted acaba de ser contratado como asistente de gerencia para un fabricante de partes de computador. En su 
primera asignacion laboral, usted necesita vigilar el tiempo que requieren los trabaj adores para completar un 
trabajo determinado que se supone que toma un promedio de 15 minutos. Su supervisor inmediato se preocupa 
porque una escasez en la mano de obra que requirio del uso de trabajadores no entrenados, ha incrementado 
el tiempo de elaboration de un trabajo por encima de los 15 minutos ordenados. Usted toma de muestra a 20 
trabajadores y halla una media de 17.3 minutos ys=l.9 minutos. <A un valor adel 1%, que le podrfa informar 
a su supervisor? 

40 . Un contratista electrico ha concluido que los hogares promedio utilizan 500 yardas de cableado electrico. 
Usted encuentra que una muestra de 15 casas utilizo 545.3 yardas con s = 166.4 yardas. un valor adel 5%, 
esta usted de acuerdo con el contratista? 


8.7 Pruebas para n 

Muchas decisiones en los negocios dependen de la proporcion o porcentaje de la poblacion que se ajusta a 
alguna caracterfstica. Un especialista en mercadeo puede querer saber la proporcion de residentes de una ciudad 
grande que se ajusta al mercado objetivo. Los gerentes con frecuencia se interesan en el porcentaje de empleados 
que consideran que las normas de la compama son demasiado opresivas. Los analistas financieros y economicos 
pueden necesitar estimar la portion de los proyectos de capital que sufren de sobrecostos. Podrfan mencionarse 
muchos otros ejemplos. 

El proceso de prueba de hipotesis para la proporcion poblacional n es muy similar al de p. Un valor Z calculado 
a partir de la muestra se compara con un valor crftico de Z con base en el valor a seleccionado. Zse calcula como 


Prueba de hipotesis para z = P ~ 71 h 

la proporcion poblacional a P 


[ 8 . 4 ] 


en donde p 


es la proporcion muestral de las observaciones que se consideran “exitos” 
es el valor planteado como hipotesis para la proporcion poblacional 
es el error estandar de la proporcion muestral. 
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Un error, <7 mide la tendencia de las proporciones muestrales a desviarse de la proporcion poblacional desconocida. 
Se calcula asi: 


Error estandar de la 
distribueion muestral 


[8.5] 

de las proporciones muestrales 

p V n 



Como director de las operaciones de mercadeo para una gran cadena minorista, usted considera que el 60% de 
los clientes de la firma se han graduado de la universidad. Usted intenta establecer una importante polftica 
respecto a la estructura de precios sobre esta proporcidn. Una muestra de 800 clientes revela que 492 clientes 
tienen grados universitarios, produciendo una proporcion muestral de/? = 492/800 = 0.615. A un nivel del 5%, ^que 
puede concluir sobre la proporcion de todos los clientes que se han graduado de la universidad? Sus hip6tesis 
son: 


El error estandar es 


Entonces, 


H 0 : ir = 0.60 H a \ 7 t ¥= 0.60 




0.615- 0.60 = 
0.017 °' 88 


En la figura 8.8, el valor a del 5% esta dividido en dos zonas de rechazo, colocando 2.5% en cada cola. El 95% 
restante dividido en 2, da un area de 0.4750; lo cual requiere de los valores crfticos de Zde ± 1 .96 utilizando la tabla 
Z. La regia de decision por tanto es: 


Regia de decision: “No rechazar H o si Z esta entre ± 1 .96. Rechazar H o si Z es mayor que + 1 .96 
o menor que -1 .96”. 

Figura 8.8 

Prueba de hipotesis 
para la proporcion 
de clientes con titulo 
universitario 

-1.96 0 0.88 1.96 Z 

I t 

Zona de no rechazo 



El Z de 0.88 esta en la zona de no rechazo. La evidencia de la muestra confirma la hipotesis de que k- 0.60. Ahora 
es posible desarrollar su politica de precios con base en esta conclusion. 

Regresando a la tabla Z, es posible calcular el valor p relacionado con esta prueba. Vale la pena recordar que 
el valor p es el valor a mas bajo al cual puede rechazarse la hipotesis nula. Se halla como el area de la cola que esta 
mas alia del valor del estadistico para la muestra. La figura 8.9 muestra que esta area es 
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Figura 8.9 

Valor p para la 
proporcion de clientes 
con titulo universitario 


La prueba de dos colas El valor p es el &rea en la 

requiere que esta area de cola que est£ mas alia del 



0.5000 - 0.3 106 = 0. 1 894. Sin embargo, debido a que es una prueba de dos colas, el valor p es 0. 1894 X 2 = 0.3788. 
Debido a que el valor a del 5% es menor que 37.88%, la hipotesis nula no se rechaza. 

A1 igual que con las pruebas para las medias, las pruebas de hipotesis de una sola cola para las proporciones 
pueden tener cola a la derecha o a la izquierda. Considerando esta prueba con cola a la izquierda. El CEO de una 
gran firma manufacturera debe garantizar que por lo menos 75% de sus empleados ha concluido un curso avanzado 
de capacitacion. De los 1,200 empleados seleccionados aleatoriamente, 875 lo han hecho. El CEO registra su 
asistencia para probar esta hipotesis y calcular el valor p. A un nivel de significancia del 5%, <? que conclusiones 
incluye usted en su reporte? 

Debido a que por lo menos el 75% se escribe como n > 0.75. las hipotesis son: 

H 0 : i t > 0.75 H a : it < 0.75 
y requiere una prueba de cola a la izquierda. Dado que 


cr„ 


(0.75)(1 - 0.75) 


1200 


= 0.0125 


yp = 875/1200 = 0.729, Z es: 


0.729 - 0.75 
0.0125 


- 1.68 


En la figura 8. 10 (A ), colocando toda la cantidad del valor ctde 0.05 en la region unica de rechazo, el drea de 0.4500 
requiere un valor crftico Z de - 1 .65. La regia de decision es: 


Regia de decision: “No rechazar H si Z es > -1 .65. Rechazar H o si Z < -1 .65”. 


Figura 8.10 

Prueba de hipotesis para la 
proporcion de empleados con 
capacitacion avanzada 



I I 
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Debido a que Z = -1.68 < -1.65. Se rechaza la hipotesis nula. El CEO debe tomar medidas para incrementar la 
proporcion de empleados a quienes se ha dado capacitacion para mejorar las habilidades en el trabajo. 

El valor p es el area en la cola que esta mas alia del valor del estadfstico para la muestra de Z = -1 .68. En la figura 
8.10 (B), un valor Z de - 1 .68 da un area de 0.4535. Por tanto, el valor p es de 0.5000 - 0.4535 = 0.0465. 


Ejercicios de la seecion 


41 . Una encuesta realizada en 1982 revelo que el 78% de quienes respondieron consideraron que estaban mejor 
financieramente que sus padres. Una encuesta mas reciente (The Wall Street Journal, abril de 1997) encontro 
que 370 de las 500 personas quienes respondieron pensaron que sus fortunas financieras eran mejores que 
las de sus padres. /,Esto sugiere un descenso en la proporcion de personas que consideran que estan 
financieramente mas estables de lo que estaban sus padres? Prueba la hipotesis a un nivel de significancia del 
1% y calcule el valor p. 

42 . Tradicionalmente el 35% de todos los creditos otorgados por Jesse James National Bank han sido para 
miembros de grupos minoritarios. Durante el aiio pasado, el banco ha hecho esfuerzos por incrementar esta 
proporcion. De 150 creditos actualmente en curso, 56 estan identificados claramente por haber sido otorgados 
a las minorfas. /,E1 banco ha tenido exito en sus esfuerzos por atraer mas clientes de las minorfas? Pruebe la 
hipotesis con un nivel de significancia del 5%. Calcule el valor p. 

43 . Midwest Productions planea comercializar un nuevo producto solo si por lo menos al 40% del publico le 
gusta. El departamento de investigation selecciona 500 personas y encuentra que 225 lo prefieren al de la 
competencia mas cercana. /,A un nivel de significancia del 2%, Midwest deberfa comercializar el producto? 

44 . Radio Shack, el minorista de electrodomesticos, anuncio que vende el 21% de todos los computadores 
caseros. ^Esta afirmacion se confirma si 120 de los 700 propietarios de computadores se los compraron a 
Radio Shack? Tome a de 5% y calcule e interprete el valor p. 

45 . El director Steven Spielberg, el segundo animador mejor pago en el ano de 1 997 (US$30,000,000), aparecio en 
el programa de Oprah Winfrey. Winfrey es la animadora mejor paga (US$97,000,000). Spielberg afirmo que 
aproximadamente ‘75% del publico en general” habfa visto su pelicula Jurassic Park . Oprah tomo una 
encuesta de 200 personas en la audiencia ese dfa y encontro que 157 habian visto la pelicula. /La afirmacion 
de Spielberg esta confirmada a un nivel de significancia del 1%? 

46 . The Wall Street Journal (marzo de 1997) informo que la insatisfaccion laboral estaba alcanzando proporciones 
de epidemia. Un estimado del 70% de los trabajadores de Estados Unidos cambiarfan su trabajo si pudieran. 
Si esto es cierto en los trabajadores de su empresa, usted planea instituir un programa para mejorar la moral 
de los empleados. Usted descubre que 1,020 trabajadores de una muestra de 1,500 expresaron insatisfaccion 
con su trabajo. /,A un nivel de significancia del 2%, deberfa usted implementar el programa? 

47 . Midlakes Commuter Service ceso voluntariamente las operaciones de vuelo de sus oficinas de Chicago 
( Chicago Tribune , junio 10 de 1997). Se estimo que mas del 18% de los vuelos de Midlakes involucraban 
aviones con fallas mecanicas. /,Este estimado se confirma a un nivel de significancia del 5% si 24 aviones 
utilizados para los 120 vuelos presentaron problemas mecanicos? 


Problema resuelto 

En 1997, la legislatura de Illinois debatio varias propuestas para reformar la financiacion de las escuelas estatales 
(Peoria Journal Star , mayo de 1997). Se aducfa que el monto promedio que in vertfa Illinois por alumno era menor 
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que el promedio de Estados Unidos de US$5,541. Un estudio realizado por Quality Counts, el “guardian” del 
estado en cuanto a la educacion basada en los ciudadanos, reporto una media de US$5,015 por alumno. 

El Presidente de la Camara de Representantes de Estados Unidos, Michael Madigan (D-Chicago), reporto que 
mas del 40% del pueblo apoyaba el plan del gobemador Jim Edgar de incrementar el impuesto a la renta estatal en 
mas del 25% para financiar la educacion. Sin embargo, el Presidente del Senado James Philip (R-Wood Dale) afirmo 
que el apoyo no era asi de penetrante. El lider republicano Lee Daniels (R-Elmhurst) reporto que se gastaba un 
promedio de US2. 500.000 por colegio en Illinois. 

Mark Boozell, el asesor del gobemador para asuntos de educacion, realizo una encuesta de opinion publica. 
Descubrio que se gastaba un promedio de US$5,1 12 con base en una muestra de 1,200 estudiantes, para igualarse 
con otros en el estudio. Se asume una desviacion estandar de US$1,254. Boozell tambien encontro que las 25 
escuelas encuestadas reportaron una media de US$2,200,000. Se asume una desviacion estandar de US$900,000. 
Boozell ademas aprendio que de los 1,000 contribuyentes a quienes se encuesto, 355 apoyaron el plan del 
gobemador de incrementar los impuestos para pagar la reforma educativa. 

a. Pruebe el argumento de que el gasto promedio en Illinois es menor que el promedio de Estados Unidos de 
US$5,541 a un nivel de significancia del 5%, y calcule el valor p. 


Solucion 


H 0 : p > 5541 H a \ p < 5541 


5112 - 5541 
1254 
VT200 


-11.85 


Regia de decision: “No rechazar H o si Z > -1 .65. De lo contrario rechazar”. 


Debido a que Z = - 11.85 <-1.65, lahipotesisnula// 0 : jU>5541 se rechaza. Los datos sustentan la afirmacion de que 
la financiacion de Illinois esta por debajo del promedio nacional. 

Como lo muestra la siguiente figura, el valor p , el area de la cola que va mas alia del valor del estadistico para la 
muestra de -1 1 .85, es virtualmente cero. 



b. Pruebe la hipotesis de Quality Counts con un nivel de significancia del 1%. Calcule el valor p. 

Solucion 

H 0 :p = 5015 H a :/jl ± 5015 


5112 - 5015 
1254 

VT200 


2.68 
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Regia de decision “No rechazar H o si -2.58 < Z < 2.58. De lo contrario rechazar”. 

Debido a que Z = 2.68 > 2.58, rechace la hipotesis nula H 0 : ji- 5015. Quality Counts parece haber subestimado 
los gastos. Como lo muestra la figura, el valor p es 0.0037 X 2 = 0.0074. 

c. Pruebe la afirmacion de Madigan a un nivel de significancia del 5%. 

Solucion 


H 0 : 7T < 0.40 H A : 7r > 0.40 


Z = 


0.355 - 0.40 


4 


(0.40)(0.60) 

1000 


-2.90 


Regia de decision: 


“No rechazar si Z < 1 .65 . De lo contrario rechazar”. 



Como lo muestra la figura, Z = -2.90 < 1 .65, la hipotesis nula H Q : n <0.40 no se rechaza. La afirmacion de 
Madigan de que mas del 40% de las personas estan a favor de la propuesta no se confirma. 

± Compare los resultados de la afirmacion de Madigan con los de Philip. Mantenga un a de 5%. 

Solucion 

H q : 7 t ^ 0.40 H a : rr < 0.40 


Regia de decision: “No rechazar si Z > -1 .65. De lo contrario rechazar”. 

Como se vio en la figura, debido a que Z = -2.9 1 < -1 .65, la hipotesis nula H Q : K > 0.40 se rechaza. La afirmacion de 
Philip de que menos del 40% de las personas estan a favor de la propuesta del gobemador queda confirmada. 
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e. Pruebe la hipbtesis de Daniel a un nivel de significance del 5%. 

Solucion 

H 0 : fi = 2.5 H a : h * 2.5 


2.2 - 2.5 
0.9 
V25 


-1.667 


Regia de decision: “No rechazar si —2.064 <t <2.064. De lo contrario rechazar” 
Ya que t = -1 .667, no rechace H 0 : fi = 2.5. La afirmacion de Daniel se confirma. 

Lista de formulas 


[8.1] 

Z = * 

<7 

Z para /x cuando a es conocida. 




[8.2] 

z = ^ ~ 

s 

Zpara fi cuando cres desconocida. 


Vn 


[8.3] 

t - * ~ Vh 
s 

t para fi con una muestra pequena 




[8.4] 

r ^ 

cx 

II 

N 

Zpara n 

[8.5] 


Error estandar de las proporciones 
muestrales. 


Ejercicios del capi'tulo 

48. Ralph Root trabaja en el vivero en el Kmart local. En su esfuerzo por estimar la tasa de crecimiento promedio 
de los pensamientos que venden, Ralph no sabe que hacer para explicar el papel del valor crftico en una 
prueba de hipotesis. Ayude al pobre Ralph a solucionar el problema. 

49. Ralph (de la pregunta anterior) debe determinar si un proveedor esta cumpliendo con las especificaciones de 
produccion requeridas. Si no lo esta haciendo y Ralph continua comprandole, tendra graves consecuencias. 
Si lo esta cumpliendo pero Ralph decide comprarle a alguien mas, poco se pierde. Plantee las hipotesis que 
Raph debe utilizar. ^Debena utilizar un nivel de significance grande o pequeno? ^Por que? 
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50 . Describa el efecto de un incremento en el tamano de la muestra en: 

a. La probabilidad de un error tipo I 

b. Los valores crfticos 

Ilustre su respuesta con una grafica apropiada. 

51 . ^Que es un error tipo II y cual es su relation con el error tipo I? P(tipo I) + P(tipo II) = 1? 

52 . ^Por que un valor p extremadamente bajo significa que la hipotesis nula es probable que sea rechazada? 
Utilice una grafica en su respuesta. 

53 . Un contrato de manejo laboral exige una production diaria promedio de 50 unidades. Una muestra de 150 dias 
revela una media de 47.3, con una desviacion estandar de 5.7 unidades. Fije a= 5% y determine si se cumple 
con la disposition del contrato. Calcule el valor p. 

54 . The Colonial Canning Company de Claremont, California, utiliza una maquina para llenar sus latas de quinoto 
(naranja china) de 1 8 onzas. Si la maquina funciona de forma inadecuada, debe reajustarse. Una muestra de 50 
latas tiene una media de 18.9 onzas con una desviacion estandar de 4.7 onzas. ^.Deberia reajustarse la maquina? 
Si a= 5%. Calcule el valor p. 

55 . Del problema anterior, se tomo una muestra de 500 latas, dando la misma media y desviacion estandar que la 
muestra mds pequena, ^deberia reajustarse la maquina? 

56 . Un articulo de la revista Fortune que discute la creciente tendencia que tienen los empleados a demandar a 
sus compamas por incumplimiento en las promesas respecto a los beneficios en salud propuestos, concluyo 
que el promedio de las demandas era por US$1 15,000. Cuarenta y dos demandas promediaron US$1 14,412. Se 
asume una desviacion estandar de US$14,000. ^La hipdtesis se confirma al nivel de significancia del 7%? 
Calcule el valor p. 

57 . Los miembros de Strain and Sweat Health Club estan molestos por una decisidn del propietario de limitar las 
reservaciones de la cancha de racketball a una restriccidn de tiempo inaceptable. Elios afirman que el tiempo 
de juego promedio dura dos horas. De los 27 ultimos juegos se obtiene una media de 1.82 horas con una 
desviacion estandar de 0.32 horas. El gerente acepta quitar el lfmite de tiempo si los miembros tienen razon en 
su afirmacion. Sea a = 2%. ^Que debe hacer el gerente? 

58 . Sports Illustrated discutid los problemas que tenfan las redes de television al transmitir los juegos de futbol 
profesional, debido a las variaciones en la cantidad de tiempo que se toma el partido. Los juegos que tomaron 
un tiempo adicional, debido a los altos marcadores o a los numerosos recesos, abarcaron la franja de tiempo 
del siguiente programa, mientras que los juegos que requerfan de menos tiempo dejaron a las cadenas con 
ffanjas de tiempo por llenar. NBC decidid probar la hipdtesis de que deberfa asignar exactamente 3 . 1 horas por 
juego. Para probar esta hipdtesis, se seleccionaron los tiempos de 12 juegos. Los resultados en horas son los 
siguientes. Si a= 1%, £qud debe hacer la NBC? 


Tiempos (en horas) para 12 partidos 
de futbol profesional en 1997 


2.91 

3.19 

3.05 

3.21 

3.09 

3.19 

3.12 

2.98 

3.17 

2.93 

2.95 

3.14 


59. El departamento de policia de Santa Clara, California, ha descubierto que los agentes de tr&nsito deberfan 
hacer un promedio de 27 comparendos por mes. Si un agente hace mas de esa cantidad, es probable que sea 
demasiado entusiasta en el ejercicio de sus funciones. Si hace menos comparendos, el agente puede no estar 
haciendo su trabajo minuciosamente. Para evaluar a sus agentes, el jefe anotd el numero de comparendos 
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realizados por los 15 agentes. Los resultados aparecen en la siguiente tabla. Con un nivel de significancia del 
5%, ^parece que los agentes estan desempenandose satisfactoriamente? 


28 

34 

30 

31 

29 

33 

22 

32 

38 

26 

25 

31 

25 

24 

31 


60 . Una politica de la compama en State Farm Insurance es restringir la proportion de reclamaciones otorgadas 
a los asegurados al 25%. De las ultimas 1,122 pdlizas, 242 compensaron en su totalidad al asegurado. Si a- 
0.10, ^se esta considerando o no la politica? Calcule el valor p. 

61 . Debido a la inflation en las notas, en la cual los profesores han venido dando notas muy altas, el decano 
insiste que cada profesor repruebe al 30% de sus estudiantes. En una muestra reciente de 315 estudiantes, el 
Profesor Nodoze reprobo a 112 estudiantes. ^E1 profesor esta cumpliendo con los requisitos que exige el 
decano? Sea a = 0.05. Calcule el valor p. 

62 . Dada la estipulacidn del decano en el problema anterior, la facultad argumenta que restringe de forma indebida 
su autoridad para calificar. El decano relaja su requerimiento afirmando que la facultad debe reprobar un 
promedio del 30% de los estudiantes. La tasa de pdrdida para 8 miembros de la facultad son: 

0.27, 0.3 1, 0.32, 0.25, 0.33, 0.25, 0.26, 0.3 1 
^E1 decano va a ponerse feliz con estos datos? Sea a = 0.01. 

63 . Un plan de reduction de peso estipula que 75% de las personas que participan en el plan deberfan perder 
entre el 5% y 12% de su peso corporal en las primeras 6 semanas. Si mas del 75% pierden la cantidad 
estipulada, la dieta es demasiado severa. Si menos del 75% de los participantes pierden la cantidad de peso 
estipulado, la dieta es demasiado suave. De las 450 personas encuestadas, 347 perdieron la cantidad de peso 
dentro del rango tolerable. A un nivel de significancia del 5%, que nos dicen estas cifras sobre la dieta? 

64 . El gerente del mercado Whatchaneed considera que el 50% de sus clientes gasta menos de US$10 en cada 
visita a la tienda. Muchas de sus decisiones en la fijacion de los precios se basan en esta suposicidn. El 
decide probar esta suposicion tomando como una muestra de 50 clientes cuyos gastos totales aparecen a 
continuation. ^Que revelan estos datos sobre las decisiones en la fijacion de precios que toma el gerente? 
Seaa=5% 


Gastos de los clientes 


US $18.17 

US $21.12 

US $4.12 

US $8.73 

US $8.42 

7.17 

17.18 

27.18 

2.17 

7.12 

2.08 

6.12 

2.17 

6.42 

9.17 

4.17 

2.12 

8.15 

12.18 

2.63 

18.02 

9.99 

3.02 

8.84 

21.22 

8.73 

10.00 

0.65 

17.17 

18.42 

4.12 

5.12 

11.12 

11.17 

4.82 

8.15 

5.12 

3.32 

17.89 

5.55 

5.15 

12.12 

4.83 

11.12 

11.11 

17.15 

18.17 

10.12 

8.92 

17.83 


65 . Brach’s Candies combina su caramelo de goma de manera tal que el 20% de las bolsas contengan por lo menos 
5 colores de gomas. Control de calidad re visa 400 bolsas y encuentra que 87 bolsas contienen mas de 5 
colores. A un nivel de significancia del 1%, £se cumple con esta caracterfstica de calidad? Calcule el valor p. 
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66. Biggie Burguer afirma que su especial de lujo tiene por lo menos 0.25 libras de came. Una muestra de 100 
hamburguesas tiene una media de 0.237 libras, con una desviacion estandar de 0.04 libras. ^Biggie Burguer es 
culpable de falsa publicidad a un nivel de significancia del 5%? 

67 . Minit-Mart, una cadena de almacenes en toda la nation, afirmo en The Wall Street Journal que no abrira una 
tienda en ninguna localidad a menos que el ingreso mediano en el vecindario sea de por lo menos de $12,000. 
Una encuesta a 200 familias de un barrio determinado, produce un ingreso promedio de US$1 1,852 con una 
desviacion estandar de US$1 ,5 17. ^Deberia Mini-Mart abrir la tienda si se cumple con todos los otros criterios 
de un sitio deseable? Sea a = 1%. 

68. Un fabricante de neumaticos ha venido produciendo llantas de inviemo en Akron, Ohio, durante mas de 40 
anos. Su mejor neumatico ha tenido un promedio de 52,500 millas de duracion, con una desviacion estandar de 
7,075 millas. Se penso que un nuevo diseno en la banda de rodamiento agregaba resistencia adicional a las 
llantas. Se prueban sesenta llantas con el nuevo diseno, revelando una media de 54,1 12 millas, con una desviacion 
estandar de 7,912 millas. un nivel de significancia del 5%, podrfa decirse que la nueva banda de rodamiento 
mejora el desgaste de la llanta? (Nota: Ademas de la desviacion estandar muestral de 7,912, la desviacion 
estandar poblacional de 7,075 tambien es conocida. ^Cual deberfa utilizarse en los calculos? ^Por que? 

69 . El espionaje industrial es un problema cada vez mayor. Business Week reporto que los primeros empleados de 
Du Pont exigieron que la empresa quimica pagara un rescate de US$10,000,000, o la competencia recibirfa el 
secreto de la compama para fabricar la Lycra, la popular fibra utilizada en la ropa interior, en los trajes de bano 
y en otras prendas. Se ha estimado que la extorsion corporativa cuesta a las compamas un promedio de mas 
de US$3,500,000. Si 75 casos de esta naturaleza se analizan y se encuentra un promedio de US$3.7 10.000 con 
una desviacion estandar de US$1,210,000, ^ese estimado se confirma a un nivel de significancia del 10%? 
Calcule el valor/?. 

70 . Rex Cutshall, director nacional de Multimedia Entertainment, desea garantizar que los episodios de La Guerra 
de las Galaxias: La Siguiente Generation ( Star Trek: The Next Generation) tengan un promedio no superior 
a 57 minutos de duracion. Ochenta episodios dan una media de 63.2 minutos con una desviacidn estandar de 
23.7 minutos: 

a. A un nivel de significancia del 1%, deberfa Rex alterar la longitud de los programas? 

b . ^Cual es el nivel de significancia mas bajo al cual Rex puede rechazar la hipotesis? 

71 . Vince Showers, director ejecutivo de Sleaz Entertainment, afirma que la edad promedio de los clientes de Sleaz 
es de por lo menos de 23 anos. Si este no es el caso, Showers enfrentara cargos de violation de las ordenanzas 
locales respecto a la decencia publica. Cien clientes promediaron 19.7 anos de edad con s - 10.2 Sea a 1%. 

a . Plantee y pruebe las hipotesis. ^Debe Showers comparecer ante la corte? 

b. Calcule e interprete el valor p. 

72 . Su empresa ha determinado en el pasado que exactamente el 53% de las personas que estan en su area de 
mercadeo prefieren su producto. Se invierten varios miles de dolares en un programa publicitario para 
incrementar su participation en el mercado. Luego, una muestra de 622 personas revela que 348 prefieren su 
producto. A un nivel de significancia del 4%, £el dinero fue bien invertido? 

73 . Usted ha estado trabajando para una empresa de publicidad en Chicago durante cinco anos. Ahora usted 
esta planeando iniciar su propia compama, pero teme perder muchos de sus clientes. Usted decide irse, s61o 
si por lo menos el 30% de las cuentas que usted maneja se iran con usted y le seguiran a su nuevo negocio. 
Como prueba, usted descubre que 14 de las 54 cuentas que tomo como muestra expresan su deseo de irse con 
usted si usted deja la compama. A un nivel de significancia del 7%, ^deberfa usted comenzar su propia 
empresa? 

74 . Como analista de mercadeo recientemente contratado para Griffin Industries, usted tiene la responsabilidad 
de garantizar que mas del 10% de la poblacion conozca su nueva lfnea de productos. De las 300 personas, 36 
expresan que si la conocen. Sea a 4%. 
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a . Plantee y pruebe las hipotesis apropiadas. <?,Ha hecho su trabajo? 

b . ^Cual es el valor a mas bajo al cual usted puede rechazar la hipdtesis nula? 

75 . Su position como representante de mercadeo para Wakco Wheels, un fabricante de carros y camiones de 
juguete para ninos menores de 5 anos, requiere que usted pruebe la durabilidad del producto. Su companfa 
afirma que el Richard Petty Rapid Roller soporta por lo menos 200 libras de presion por pulgada cuadrada 
como mfnimo sin danarse. Usted prueba 100 de estos modelos y halla un punto de equilibrio promedio de 195 
libras, con una desviacion estandar de 22.2 libras: 

a. iSe confirma lo que dice su companfa a un nivel de significancia del 5%? 

b. Si la afirmacion es verdadera, ^cual es la probabilidad de obtener un valor Z igual de bajo o mas bajo que 
el obtenido por la muestra? 

76. Un proveedor de Ralph’s Tanning Parlor and Quickie Car Wash Emporium insiste en que no mis del 33% de 
los clientes de Ralph gastan menos de US$20 en promedio por visita. De los 80 clientes tornados aleatoriamente, 
29 gastaron menos de US$20. 

a. <[,E1 proveedor esta en lo cierto a un nivel de significancia del 1%? 

b. ^Cual es el valor a mas bajo al cual se considerarfa que el proveedor esta errado? 

77 . Weight Watchers afirma que las personas que utilizan su programa pierden un promedio de 42 libras. Una 
muestra de 400 personas determino que quienes hacfan la dieta perdfan un promedio de 43.17 libras, con una 
desviacion estandar de 8.7 libras: 

a . ^La afirmacion se confirma al nivel del 5%? 

b. ^Cual es el valor a mas bajo al cual puede rechazarse la afirmacion? 

78 . Hilda Radner posee una empresa publicitaria en Palo Alto, California. El negocio ha mejorado recientemente 
e Hilda piensa que los ingresos diarios son superiores a US$500 comparado con el ano anterior. Una muestra 
de 256 dfas revela una media de US$520 y una desviacidn estandar de US$80.70. 

a. A un nivel de significancia del 1%, ^Hilda esti en lo cierto? 

b . Si los ingresos promedio en realidad son de US$507, ^cual es la probabilidad de cometer un error tipo II? 
Dibuje las curvas normales adecuadas para ilustrar. 


D PUESTA EN ESCENA 


Como se vio en la secci6n Planteamiento del Escenario a 
comienzos de este capitulo, First Bank of America esti 
planeando un anilisis estadfstico extensivo de sus 
operaciones. El Sr. Hopkins debe hacer pruebas sobre 
diferentes aspectos de las operaciones del First Bank. Los 
resultados de estas pruebas ayudarin en la formulacidn de 
muchas polfticas operativas. El Sr. Hopkins toma de 
muestra 1,200 clientes y halla que 850 se oponen a que se 
cobre en el extracto mensual US$2 cada mes por los cheques 
anulados del depositante. Estos 1,200 clientes tienen un 
deposito promedio en sus cuentas de ahorro de US$4,533, 


con una desviacidn estindar de US$1,776. El Sr. Hopkins 
tambidn encontrd que 27 negocios locales tenfan saldos 
promedio de US$344,500 con una desviacidn estindar de 
US$104,600. 

Con base en estos datos, el Sr. Hopkins determina que 
si mis del 65% de los depositantes se niega al recargo de 
US$2, la polftica no se implantari. Ademis, si las cuentas 
de ahorros de los depositantes individuales son de US$4,500 
en promedio, planea ofrecer un programa de tasa de interns 
graduada con tasas mis elevadas para las cuentas mis 
grandes. Finalmente, si las cuentas comerciales tienen por 
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lo menos US$340,000, el Sr. Hopkins establecerd una 
divisidn administrativa para manejar las cuentas 
comerciales. 



Ayude al Sr. Hopkins en su esfuerzo. Suministre todas 
las conclusiones y hallazgos relevantes incluyendo los 
valores p cuando sea apropiado. Pre sente sus conclusiones 
como se especifica que el apendice I. 


Del escenario a la vida real 

Los datos sobre participacion de mercado en los depositos bancarios se obtiene de la relacion del total de 
depositos de un solo banco con los depositos agregados en todos los bancos comerciales nacionales. Si usted 
fuera Lawrence Hopkins de First Bank of America, /,en donde obtendna datos para el analisis sobre participacion 
de mercado que aparece en la section inicial de este capitulo “Planteamiento del Escenario”? ^Espera tener 
dificultades al aprender sobre los depositos totales en su propio banco? ^En donde buscarfa las cifras agregadas 
de la industria? 

Sorprendentemente, las cifras agregadas que necesitara ya se encuentran disponibles en Internet provenientes 
de Board of Governors del Sistema Federal de Reservas ( www.bog.frbfod.us ). En la pagina de presentation de 
Board of Governors, desplacese hasta el encabezado Domestic and International Research (Investigation Nacional 
e Intemacional). Bajo este encabezado haga clic en “Estadisticas: Publicaciones y datos historicos”. All! usted 
puede escoger si desea ver una gran variedad de datos bancarios de Estados Unidos. Seleccione “Assets and 
Liabilites of Commercial Banks in the United States”, “H. 8 Activos y pasivos de los Bancos Comerciales en 
Estados Unidos-datos historicos”. All! encontrara aproximadamente 10 anos de datos mensuales y semanales 
sobre depositos, y datos actuales sobre el mes anterior a la fecha de su busqueda. Compare lo facil de obtener los 
datos de Board of Governors a traves de American Banking Association (www.aba.com). 






Plan del capi'tulo 

Muchos problemas en los negocios requieren la comparaci6n de dos poblaciones. Este capftulo analiza las 
situaciones en las cuales puede hacerse dicha comparacidn. Las ilustraciones muestran las circunstancias en las 
cuales es esencial comparar dos poblaciones y la forma apropiada como deben hacerse tales comparaciones. 
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E S C E N A R I 0 


La revista Fortune (octubre de 1996) publico una serie de 
articulos que discutian las tendencias del comercio exterior 
en los Estados Unidos. Estos articulos se centraron en las 
grandes sumas de dinero involucradas en las transacciones 
intemacionales y en el papel que juegan Europa y Asia 
como lugares que compiten por la inversidn de Estados 
Unidos. La inversion norteamericana en Europa fue de un 
total de US$364 billones en 1996, incrementando el 17% 
sobre el nivel maximo establecidojusto al ano anterior. Se 
presentd un incremento del 16% en la participacidn 
comercial de Estados Unidos en Asia, elevando el nivel de 
inversion en dicha region a m£s de US$100 billones. Estas 
tendencias se reflejan en la figura adjunta. 

Los articulos tambien retaron la sabiduria convencional 
de que las empresas de Estados Unidos preferian invertir 
en las economias crecientes de Asia mas que en el gran 
mercado existente en Europa. Sugirieron que los intereses 
comerciales nacionales todavia consideran que Europa ofrece 
una oportunidad mas lucrativa para el crecimiento 


corporativo. Como analista intemacional para su empresa, 
usted debe preparar un reporte comparativo detallado sobre 
las ventajas de la participation en cada una de estas dos 
teas geopoliticas. Este reporte debe presentarse en una 
reunion ante muchos de los directivos de las divisiones de 
las empresas, El proposito de la reunion es decidir el curso 
fiituro de la actividad inversionista en el extranjero para 
los prdximos aiios. Esto requerira que usted: 

• Compare el rendimiento promedio sobre la inversidn 
en Europa con la de Asia. 

• Determine cual tea tiene un porcentaje menor de fallas 
en los proyectos de inversidn. 

• Estime el nivel de inversidn promedio en Europa y 
Asia. 

• Proporcione una comparacion rainuciosa de todas las 
medidas financieras relevantes en estos dos mercados 
extranjeros. 


Inversiones de Estados Unidos en el exterior 

(Billones de ddlares) 


1 Europa 

If Asia 



9.1 Introduction 

Los capitulos 7 y 8 mostraron como construir estimaciones por intervalo y probar hipotesis para una sola poblacion. 
Este capitulo analiza como se pueden utilizar estas herramientas para comparar dos poblaciones. Por ejemplo, se 
puede querer construir una estimation por intervalo para la diferencia entre dos medias poblacionales o probar la 
hipotesis de que dos medias poblacionales son iguales. Muchas preguntas importantes pueden resolverse 
comparando dos poblaciones. ^Cual es la diferencia, si la hay, entre la durabilidad promedio de las botas de esqui 
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elaboradas por North Slope y las producidas por Head? ^Los trabaj adores de una planta producen en promedio 
mas que los trabajadores de una segunda planta? ^Hay alguna diferencia entre la proportion de unidades 
defectuosas producidas por un metodo y las producidas por otro metodo altemativo? 

El procedimiento exacto a seguir para la realizacidn de estas pruebas depende de la tecnica de muestreo que se 
utilice. Las muestras para pruebas con dos poblaciones pueden ser o 1) independientes o 2) por pares. Como el 
t£rmino lo indica, el muestreo independiente se realiza recolectando muestras independientes de cada poblacion. 
Incluso las muestras no tienen que ser del mismo tamano. Con el muestreo por pares, las observaciones de cada 
poblacion tienen su correspondiente, lo cual se describira mas tarde detalladamente. Se comienza con una 
explication sobre muestreo independiente. 


9.2 Estimacion por intervalo en el caso de muestras 
independientes 

Aqui el interns esta en estimar la diferencia entre dos medias poblacionales (JJ. { - /t 2 ). El metodo apropiado depende 
de los tamanos de las muestras n l yn r Si tanto n, como n 2 son grandes (por lo menos 30), la tecnica difiere en algo 
de aquella que se utiliza cuando alguno o ambos tamanos muestrales son de menos de 30. Veamos primero el 
metodo cuando ambas muestras son grandes. 


A. Estimacion con muestras grandes 

La estimacion puntual de la diferencia entre (//, - n 2 ) estd dada por la diferencia entre las dos medias muestrales 
(X , -X 2 ). Ya que muchas muestras diferentes pueden tomarse de cada poblacidn, resulta toda una distribucidn de 
diferencias de estas medias muestrales. Si tanto n l y n 2 son grandes, la distribucion de las diferencias entre las 
medias muestrales (X 2 -X 2 ) es una distribucion normal centrada en (jl l - H 2 ) tal y como lo muestra la figura 9.1 


Figura 9.1 

Distribucion muestral 
de las diferencias 
de las medias 
muestrales (x^ - x 2 ) 


Debido a que cada 



Dada esta distribucidn normal de las diferencias entre las medias muestrales, la desviacidn normal Z puede 
utilizarse para construir el intervalo. El procedimiento es muy parecido al desarrollado en el capitulo 7 para una 
sola poblacidn. Utilizando (X^-F 2 ) como la estimacidn puntual de la diferencia entre las dos medias poblacionales, 
se aplica un multiplicador de confianza para obtener los limites superior e inferior del intervalo. 


Intervalo de confianza para 
la diferencia entre dos medias 

I.C. para (mi ~ M 2 ) = - X 2 ) ± 

[9.1] 

poblacionales - muestras grandes 






232 ESTADISTICA APLICADA A LOS NEGOCIOS Y [A ECONOMIA 


en donde <7^ ^ es el error estandar de las diferencias entre las medias muestrales. De la misma manera que con 
cualquier error estandar, <7 X x mide la tendencia que tienen las diferencias entre las medias muestrales a variar. 
Se tiene que: 


Error estandar de las diferencias 
entre medias muestrales 



[9.2] 


en donde a\ y d; son las dos varianzas poblacionales. En el evento probable que < 7 ~ y <T; sean desconocidas, 
deben utilizarse las varianzas muestrales s* y s\. El estimado del error est&ndar se vuelve entonces 


Estimation del error estandar _ /sf 

de la diferencia entre medias muestrales s ~ x ~ h Vn, n 2 


[9.3] 


El intervalo para la diferencia en las medias muestrales es entonces 


Intervalo de confianza cuando 



las varianzas poblacionales 

I.C.para (m , - M 2 ) = (*i ~ X 2 ) ± Zs- x _ Xi 

[9.4] 

son desconocidas 



Vale la pena destacar que no se estd interesado en el valor de cualquiera de las medias poblacionales, sino 
solamente en la diferencia que existe entre las dos medias poblacionales. 

Transfer Trucking transporta remesas entre Chicago y Kansas City por dos rutas. Una muestra de 100 camiones 
enviados por la ruta del norte reveld un tiempo promedio de transito de X N = 17.2 horas con una desviacion 
estandar de S N = 5.3 horas, mientras que 75 camiones que utilizan la ruta del sur necesitaron un promedio de X s = 
19.4 horas con una desviacion estandar de s =4.5 horas. Delmar, el despachador de Transfer Trucking, desea 
desarrollar un intervalo de confianza del 95% para la diferencia en el tiempo promedio entre estas dos rutas 
altemas. 

Debido a que las desviaciones estandar de la poblacion son desconocidas, el error estdndar es 




to> ! + (t5? = 0 . 742 


100 


75 


Un intervalo del 95% requiere un valor Z de 1.96. Entonces el intervalo es 


I.C.para (fj. N - /i s ) = (17.2 - 19.4) ± (l.96)(0.742) 
-3.7 < - Ms) =£ -0.75 


Los resultados pueden interpretarse como: 

1. Delmar puede estar 95% seguro de que (jx N - m s ) esta entre -3.7 horas y -0.75 horas. 

O, debido a que Delmar resto la media de la ruta del sur de la media de la ruta del norte y obtuvo numeros 
negativos, 

2. Delmar puede tener un 95% de confianza en que la ruta del sur se toma entre 0.75 horas y 3.7 horas mas. 
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Ejemplo 9.1 

Charles Schwab, del servicio de corretaje de descuentos, recientemente instituyo dos programas 
de capacitacion para los representantes de mercadeo telefonico contratados recientemente. Para 
probar la efecti vidad relativa de cada programa, a 45 representantes entrenados en el primer programa 
se les hizo la prueba de competencia. El puntaje promedio fue H! =76.00 con s i = 13.50 puntos. Las 
40 personas entrenadas bajo el segundo programa reportaron un puntaje promedio de JSj = 77.97 y 
s 0 = 9.05. La gerencia desea saber si un programa de entrenamiento es mas efectivo que el otro. 
Siendo usted la persona seleccionada para tomar esta determination, usted decide construir un 
intervalo de confianza del 99% para hallar la diferencia entre los puntajes de competencia promedio 
de los empleados entrenados que se encuentran en cada programa. Usted tambien es responsable 
de recomendar cual programa de entrenamiento debera utilizar la compama exclusivamente. 

Solution 

El error estandar de la diferencia entre la media muestral es 




El intervalo del 99% es 


r (13.50) 2 (9.05) 2 

45 + 40 


= 2.47 


I.C.para (/*, - /x 2 ) = (76.00 - 77.97) ± (2.58)(2.47) 
-8.34 < 0*, - fjL 2 ) < 4.40 


Interpretation 

Usted puede tener un 99% de seguridad en que - jj, 2 ) esta entre -8.34 puntos y 4.40 puntos. 
Dicho de otra manera, usted puede reportar con un 99% de confianza que los puntajes promedio de 
quienes recibieron entrenamiento con el programa 2 estan entre 4.40 puntos menos y 8.34 puntos 
mas que los entrenados con el programa 1. Es importante saber que debido a que el intervalo 
contiene cero, usted puede estar 99% seguro de que no hay diferencia en los puntajes promedio. Se 
puede concluir que cualquiera de los programas puede utilizarse para entrenar a los representantes 
recientemente contratados. 


Ejercicios de la seccion 


1. Clark Insurance vende polizas de seguro a los residentes en toda el area de Chicago. El propietario desea 
estimar la diferencia en las reclamaciones promedio de las personas que viven en zonas urbanas y las de 
aquellas que residen en los suburbios. De las 180 polizas urbanas seleccionadas para la muestra, se reporto 
una reclamacion promedio de US$2,025, con una desviacion estandar de US$918. Las 200 polizas urbanas 
revelaron una reclamacion promedio de US$1 ,802 y s = US$5 12. ^Que dice al propietario un intervalo del 95% 
sobre las reclamaciones promedio registradas por estos dos grupos? 

2. Dos procesos de produccion se utilizan para producir tubos de acero. Una muestra de 100 tubos tomada del 
primer proceso de produccion tiene una longitud promedio de 27.3 pulgadas y^ = 10.3 pulgadas. Las cifras 
correspondientes para los 100 tubos producidos por el segundo metodo son 30. 1 y 5.2. ^Que revela un intervalo 
del 99% sobre la diferencia en las longitudes promedio de los tubos producidos por estos dos metodos? 

3. Chapman Industries utiliza dos dispositivos de contestador telefonico. Chuck Chapman desea determinar si 
los clientes que llaman se dejan esperando, en promedio, mas en un sistema que en el otro. Si 75 llamadas en 
el primer sistema reportaron un tiempo de espera promedio de 25.2 segundos con s = 4.8 segundos y 70 
llamadas del segundo sistema dieron una media de 21.3 segundos con ,y= 3.8 segundos, ^ que recomendacion 
proporcionana usted a Chuck si el desea minimizar el tiempo de espera con base en un intervalo del 90% 
estimando de la diferencia de tiempo de espera promedio? 
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4. Se utilizan dos disenos de production para fabricar cierto producto. El tiempo promedio requerido para 
producir el producto utilizando el viejo diseno fue de 3.51 dias con s — 0.79 dias. El nuevo diseno requirio un 
promedio de 3.32 dias con s = 0.73 dias. Muestras de igual tamano de 150 se utilizaron en ambos disenos. ^Que 
revela un intervalo del 99% sobre la diferencia entre los tiempos promedio que se requieren para hacer el 
producto? Determine cual diseno debena utilizarse. 

5. Explique exactamente lo que en realidad mide el error estandar de la diferencia entre medias muestrales. 

B. Estimation con muestras pequenas: La distribution t 

Si cualquier muestra_es pequena (menor que 30), no se puede asumir que la distribucion de las diferencias en las 
medias muestrales (. X l - X 2 ) se ajusta a una distribucion normal. Por tanto, no puede utilizarse la desviacion normal 
Z. Si 

1. Las poblaciones estan distribuidas normalmente o distribuidas casi normalmente, y 

2. Las varianzas poblacionales son desconocidas, 

Se debe regresar a la distribucion t . 

Para aplicar adecuadamente la distribucion t, tambien se debe determinar si las varianzas de las dos poblaciones 
son iguales. ^Como se puede asumir que tales varianzas son iguales si, como se anoto anteriormente, no se sabe 
cuales son? Muchos procesos de las lineas de ensamble utilizan maquinas para llenar los contenedores de 
producto tales como latas, botellas y cajas. Cuando se ajustan periodicamente las maquinas para garantizar la 
operation adecuada, se asume que el nivel de contenido promedio ha variado pero no se conoce la varianza en los 
niveles de contenido antes y despues del ajuste; aunque sean desconocidas, siguen sin cambio alguno. Otros 
ejemplos tambien prevalecen, en los cuales la suposicion de varianzas iguales es razonable. Mas tarde, en este 
capitulo, se presentara un metodo para probar la igualdad de las dos varianzas. Por ahora, se analizaran los 
intervalos de confianza cuando 1) se asume que las varianzas son iguales y cuando 2) no se asume que las 
varianzas sean iguales. 

1 . Suposicion de que las varianzas cr 2 = o\ son iguales pero desconocidas Si las varianzas de las dos 

poblaciones son iguales, existe alguna varianza & comun a ambas poblaciones. Es decir o\ - c\ = a 2 . Sin 
embargo, debido al error de muestreo, si se toma una muestra de cada poblacidn, las dos varianzas de la muestra 
probablemente diferiran una de la otra asi como de la varianza comun & . Pero debido a que las poblaciones tienen 
una varianza comun, los datos de ambas muestras pueden mancomunarse (pooled) para obtener un solo estimado 
de & . Esto se hace calculando el promedio ponderado de las dos varianzas de la muestra, en donde los pesos son 
los grados de libertad n - 1 para cada muestra. Esta estimation mancomunada (pooled estimate) de la varianza 
poblacional comun s 2 p es: 



El intervalo de confianza para la diferencia entre las dos medias poblacionales se halla entonces con una distribucion 
t con n { + n 2 - 2 grados de libertad. 




Intervalo para la diferencia entre 

medias poblacionales cuando i.c.para(/i, - m 2 ) = (Xj - x 2 ) ± tyj 

a] = o\ desconocidas 

li + i [9.6] 

n \ n 2 
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En la cafeteria de los estudiantes, una maquina expendedora de bebidas dispensa bebidas en tazas de papel. 
Una muestra de 15 tazas da una media de 15.3 onzas con una varianza de 3.5. Despues de ajustar la maquina, una 
muestra de 10 tazas produce un promedio de 17.1 onzas con una varianza de 3.9. Si se asume que s 1 es constante 
antes y despues del ajuste, construya un intervalo de confianza del 95% para la diferencia entre los contenidos 
promedio de llenado. Se asume que las cantidades dispensadas estan distribuidas normalmente. 

Entonces, 

2 = 3. 5(14) + 3.9(9) 

Sp 15 + 10-2 
= 3.66 

Con a= 0.05 (un nivel de confianza del 95%) y n x + n 2 - 2 = 23 g.l., la tabla t indica un valor de 2.069. 

LC.para fi } - fi 2 = (* 5 -3 - 17.1) ± 2.069 

= -1.8 ± 1.61 
- 3.41 < jjL { — fi 2 < “0.19 


Restando el nivel de contenido promedio despues del ajuste (17.1), del nivel de contenido promedio antes del 
ajuste (15.3), resultan valores negativos tanto para los extremos inferiores como superiores del intervalo. Es decir, 
el intervalo no contiene cero. Por consiguiente se puede tener un nivel de confianza del 95% en el que el ajuste 
incremento el nivel de contenido promedio entre 0.19 onzas y 3.41 onzas. 


Ejemplo 9.2 

Las negociaciones salariales entre su empresa y el sindicato de sus trabaj adores estan a punto de 
romperse. Existe un desacuerdo considerable sobre el nivel salarial promedio de los trabajadores en 
la planta de Atlanta y en la planta de Newport News, Virginia. Los salarios fueron fijados por el 
antiguo acuerdo laboral de hace tres anos y se basan estrictamente en la antigiiedad. Debido a que 
los salarios estan controlados muy de cerca por el contrato laboral, se asume que la variacion en los 
salarios es la misma en ambas plantas y que los salarios estan distribuidos normalmente. Sin 
embargo, se siente que existe una diferencia entre los niveles salariales promedio debido a los 
patrones de antigiiedad diferentes entre las dos plantas. 

El negociador laboral que representa a la gerencia desea que usted desarrolle un intervalo de 
confianza del 98% para estimar la diferencia entre los niveles salariales promedio. Si existe una 
diferencia en las medias, deben hacerse ajustes para hacer que los salarios mas bajos alcancen el 
nivel de los mas altos. Dados los siguientes datos, ^que ajustes se requieren, si es el caso? 


Solucion 


Las muestras de trabajadores tomadas de cada planta revelan la siguiente informacion. 



Planta de Atlanta 

Planta de Newport News 

n A 

= 23 

", = 19 


= US$17.53 por hora 

X N = US$15.50 

$ 

- 92.10 

S 2 a = 87.10 


Entonces: 


92.10(22) + 87.1(18) 
23+19-2 


- 89.85 
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Dado que a = 0.02 y g.l. = 23 + 19 - 2 = 40, la tabla F en el apendice III revela un valor t de 2.423. 

I.C.para Mi ~ M 2 = (17-53 - 15.5) ± 2.423 yj^^+ 

= 2.03 ± 7.12 
-5.09 < - /x 2 < 9.15 


Interpretation 

Se puede estar 98% seguro de que el salario promedio en Atlanta esta entre US$9.15 mas que en 
Newport News y US$5.09 menos que en Newport News. Debido a que este intervalo contiene el 
valor US$0, la conclusion es que es posible que no exista diferencia. No se garantiza ajuste. 


2. Varianzas desiguales Si las varianzas de la poblacion son desiguales o no existe evidencia para asumir una 
igualdad, los procedimientos descritos anteriormente no se aplican directamente porque la distribucion de las 
diferencias entre las medias muestrales no se ajustan a una distribucion t con n x + n 7 -2 g.l. De hecho, no se ha 
encontrado que una distribucion exacta describa este proceso de muestreo, y solo se han desarrollado 
aproximaciones. Se ha propuesto una aproximacion tal que utilice el estadfstico t con g.l. levemente alterados. En 
el evento que a\ ^ a 2 v se encuentra que los grados de libertad son 


Grados de libertad cuando 
las varianzas poblacionales 
no son iguales 

_ (■*]/” i + s\/n 2 ) 2 

[9.7] 

(s7"i)7("i - 1) + (sl/n 2 ) 2 /(n 2 - 1) 

Debido a que g.l. se calcula de esta manera alterada, el estadfstico t se simboliza con t\ El intervalo de confianza 
se ha calculado entonces como 

Intervalo para la diferencia entre 
medias poblacionales 

_ _ s * 

I.C.para fi\ ~ t*"> — (Xj ” X 2 ) ± f \ f- 1 + ~ 

v n { n 2 

[9-8] 


The Wall Street Journal describe dos programas de entrenamiento utilizados por IBM. Doce ejecutivos a 
quienes se les dio el primer tipo de entrenamiento obtuvieron un promedio de 73.5 en la prueba de competencia. 
Aunque el articulo de noticias no reporto la desviacion estandar para estos 12 empleados, se asume que la 
varianza en los puntajes para este grupo fue de 100.2. Quince ejecutivos a quienes se les administro el segundo 
programa de entrenamiento obtuvieron un promedio de 79.8. Se asume una varianza de 121.3 para este segundo 
grupo. Haga un intervalo de confianza del 95% para la diferencia en los puntajes promedio para todos los 
ejecutivos que ingresaron a estos programas: 


1 = (100-2/12 + 121.3/15) 2 

§ ' ' (100.2/12)711 + (121.3/15)714 

= 24.55 

Si g.l. es fraccionario, se aproxima hacia abajo, hacia el entero inmediatamente anterior. Asi, g.l. = 24. Un intervalo 
de confianza del 95% con 24 grados de libertad requiere un valor f de 2. 064. 
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I.C. para 


M i £4 


- X 2 ) ± /' 



- (73,5 ~ 79.8) ± 2.064 



+ 


121.3 

15 


- -6.3 ± 8.36 
— 14.66 ^ /x , — jjl 2 < 2.06 


Debido a que el intervalo contiene cero, no existe una fuerte evidencia de que exista diferencia alguna en la 
efectividad de los programas de entrenamiento. 


Ejemplo 9.3 

Acme Ltd. vende dos tipos de amortiguadores de caucho para coches de bebes. Las pruebas de 
desgaste para medir la durabilidad revelaron que 13 amortiguadores del tipo 1 duraron un promedio 
de 1 1.3 semanas, con una desviacion estandar de 3.5 semanas; mientras que 10 del tipo 2 duraron 
un promedio de 7.5 semanas, con una desviacion estandar de 2.7 semanas. El tipo 1 es mas costoso 
para fabricar y el CEO (Director Ejecutivo) de Acme no desea utilizarlo a menos que tenga un 
promedio de duracion de por lo menos ocho semanas mas que el tipo 2. El CEO tolerara una 
probabilidad de error de solo el 2%. No existe evidencia que sugiera que las varianzas de la duracion 
de los dos productos sean iguales. 


Solucion 


X x = 11.3 X 2 - 7.5 

n x = 13 n 2 = 10 

s { = 3.5 s 2 = 2.7 

_ (sf/n, + slln 2 ) 2 

8 ‘ ' (s 2 l /n l ) 2 /(n l - 1) + (sl/n 2 ) 2 /(n 2 - 1) 

_ [(3.5) 2 / 13 + (2.7) 2 / 10] 2 
" [(3.5) 2 / 1 3] 2 [(2.7)VlO] 2 

12 9 

= 20.99 « 20 


Un intervalo de confianza del 98% (a=0.02) con 20 g.l. requiere un valor t de 2.528. 


I.C. para Mi “ M 2 = (11.3 - 7.5) ± 2.528 



+ 


(2.7) 2 

io 


= 3.8 ± 3.3 

0.5 < jjl 1 - fL 2 < 7.1 semanas 


Interpretacion 

Acme puede estar 98% seguro de que el tipo 1 dura entre 0.5 y 7.1 semanas mas que el tipo 2. Debido 
a que la diferencia requerida de ocho semanas no esta en el intervalo, el CEO puede estar 98% 
seguro de que no desea utilizar el tipo 1 . 
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Ejercicios de la seecion 


6 . iQue condiciones debe reunir la distribution t antes que pueda utilizarse? 

7 . Diecisiete latas de Croc Aid presentan una media de 17.2 onzas, con una desviacion estandar de 3.2 onzas, y 
13 latas de Energy Pro producen una media de 18.1 onzas y s = 2.7 onzas. Asumiendo varianzas iguales y 
distribuciones normales en los pesos de la poblacion, iquc conclusiones se pueden sacar respecto a la 
diferencia en los pesos promedio, con base en un intervalo de confianza del 98%? 

8 . Grow-rite vende un fertilizante comercial producido en dos plantas de Atlanta y Dallas. Las quejas recientes 
de un cliente sugieren que a los envios de Atlanta les falta peso, comparados con los envios de Dallas. <-,Si 10 
cajas de la planta de Atlanta tienen un promedio de 96.3 libras con 5 = 12.5 y 15 cajas de la planta de Dallas 
tienen un promedio de 101.1 con s = 10.3, un intervalo de confianza del 99% confirma esta queja? Se asumen 
varianzas iguales. 

9 . Opus, Inc. ha desarrollado un proceso para producir oro a partir del agua de mar. Quince galones tornados del 
oceano Pacifico produjeron una media de 12.7 onzas de oro por galon con s = 4.2 onzas, y 12 galones del 
oceano Atlantico produjeron cifras similares de 15.9 y 1.7. Con base en un intervalo del 95%, ^cual es su 
estimado de la diferencia en las onzas promedio de oro provenientes de estas dos fuentes? No existe razon 
para asumir que las varianzas son iguales. 

10 . Ralphie comienza la universidad en otono proximo. Toma muestras de apartamentos en los extremos norte y 
sur de la ciudad para ver si hay alguna diferencia en las rentas promedio. Los apartamentos que estan en el 
norte reportan rentas de US$600, US$650, US$530, US$800, US$750, US$700 y US$750, y los del sur reportaron 
rentas de US$500, US$450, US$800, US$650, US$500, US$500, US$450, y US$400. Si no existe evidencia 
alguna de que las varianzas sean iguales, ^que dice a Ralphie un intervalo del 99% sobre la diferencia en las 
rentas promedio? 

11 . Bigelow Products desea desarrollar un intervalo del 95% para estimar la diferencia en las ventas semanales 
promedio en dos mercados objetivo. Una muestra de 9 semanas en el mercado 1 produjo una media y una 
desviacion estandar en cientos de dolares de 5.72 y 1.008 respectivamente. Las cifras comparables para el 
mercado 2, con base en una muestra de 10 semanas, fueron de 8.72 y 1.208. i Si se asumen varianzas iguales, 
que resultados reportan? 

12 . U.S. Manufacturing compra materias primas de dos proveedores. La gerencia esta preocupada sobre los 
retrasos en la produccion debido a que no se reciben los envios a tiempo. Una muestra de 10 envios del 
proveedor A tienen un tiempo de entrega promedio de 6.8 dias y s= 2.57 dias mientras que 12 envios del 
proveedor B tienen un promedio de 4.08 dias y s = 1.93. Si no se pueden asumir varianzas iguales, £que 
recomendacion hana con base en un intervalo del 90% para la diferencia en los tiempos promedio de entrega? 


9.3 Estimation del intervalo con muestras pareadas 

Tambien denominadas pares correspondientes, las muestras pareadas involucran un procedimiento en el cual 
varios pares de observaciones se equiparan de la manera mas proxima posible, en terminos de caracterfsticas 
relevantes. Los dos grupos de observaciones son diferentes solo en un aspecto o “tratamiento”. Toda diferencia 
subsiguiente en los dos grupos se atribuye a dicho tratamiento. Las ventajas de las muestras pareadas son: 1) 
pueden utilizarse muestras mas pequenas, 2) se encuentran varianzas mas pequenas, 3) menos grados de libertad 
se pierden en el analisis, y 4) resulta un error de muestreo mas pequeno (la variacion entre observaciones se 
reduce debido a que corresponden de la forma mas proxima posible). Por este motivo se prefieren las muestras 
pareadas si su aplicacion es posible. 


Muestras pareadas Se llaman pares correspondientes dos observaciones que son lo 
mas similares posible entre si. Solo difieren en un aspecto relevante. 
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Supongamos que un investigador medico desea probar los efectos de nuevos medicamentos sobre los niveles 
de presion sanguinea en los pacientes. Veinte personas en un grupo se les hace corresponder de la manera mas 
proxima posible con 20 personas de un segundo grupo en terminos de peso, edad, sexo, nivel de actividad, 
colesterol y cualquier otro factor que pueda afectar la presion sanguinea. Tendremos entonces 20 pares de 
“gemelos identicos”. A uno de los grupos se les proporciona una nueva droga, y el otro recibe otra medicina. Solo 
el investigador sabe cual grupo recibe cada medicamento. Toda diferencia subsiguiente, buena o mala, en las 
presiones sangumeas de los “gemelos” se atribuye a las medicinas debido a que se han “corregido” todos los 
otros factores relevantes que afectan la presion sanguinea (como la edad y el sexo); es decir, se han elaborado 
pares de observaciones (gemelos) que son identicos en terminos de los demas factores relevantes. 

Otro metodo para utilizar muestras pareadas involucra el analisis de las mismas observaciones antes y despues 
del tratamiento. Una practica comun en la industria es evaluar a los empleados en los programas de capacitacion. 
Entonces se tiene un puntaje “antes” y uno “despues” de la capacitacion en cada observation (empleado). Todo 
cambio en el puntaje puede atribuirse a esta formation adicional. (A1 investigador deberia prevemrsele que algo 
de sesgo puede afectar el muestreo debido a que los empleados pueden ofenderse por sentirse evaluados o 
pueden reeordar sus respuestas de la primera evaluation y tratar de ser consistentes en las mismas). 

Las muestras pareadas tienen ciertas ventajas ya que las muestras mas pequenas con frecuencia conduciran 
a resultados mas precisos; si controla los demas factores importantes, el investigador no tendra que tomar 
muestras grandes para reducir el error de muestreo. 

Para ilustrar se asume que se tienen puntajes de la prueba de 10 empleados antes y despues de haberseles 
impartido capacitacion laboral adicional. Los puntajes aparecen en la tabla 9.1. 


Tabla 9.1 

Puntajes 

de la prueba antes 
y despues 
de la capacitacion 
en el trabajo 


Empleado 

Puntaje antes 
de la capacitacion 
en el trabajo 

Puntaje despues 
de la capacitacion 
en el trabajo 

d, 

d 2 , 

1 

9.0 

9.2 

-0.2 

0.04 

2 

7.3 

8.2 

-0.9 

0.81 

3 

6.7 

8.5 

-1.8 

3.24 

4 

5.3 

4.9 

0.4 

0.16 

5 

8.7 

8.9 

-0.2 

0..04 

6 

6.3 

5.8 

0.5 

0.25 

7 

7.9 

8.2 

-0.3 

0.09 

8 

7.3 

7.8 

-0.5 

0.25 

9 

8.0 

9.5 

-1.5 

2.25 

10 

7.5 

8.0 

-0.5 

0.25 


74.0 

mo 

mo 

7.38 


Sea d. la diferencia entre todo par correspondiente. La media de las diferencias entre todos los pares seria 
entonces: 


Diferencia promedio entre ^ = Sty 

las observaciones pareadas n 


[ 9 . 9 ] 


-5.0 

10 


-0.5 


La desviacion estandar de estas diferencias es: 
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Desviacion estandar de las diferencias 
entre las observations pareadas 


Sa = 


Zdj - nd 1 
n - 1 


[9.10] 


7.38 - 10(— 0.5) 2 


= 0.736 

Como n < 30 y la desviacion estandar de las diferencias de los puntajes a d es desconocida, se requiere el uso del 
estadfstico t. Si n hubiera sido mayor que 30 o o d fiiera conocido, el estadistico Z se hubiera podido utilizar. 
Ademas, debe asumirse que los valores d siguen una distribucion normal. La distribucion de los puntajes puros 
en si misma es inmaterial, pero los valores d deben ser normales. 

Entonces para un nivel de confianza del 90% y n - 1 = 9 grados de libertad, un intervalo de confianza para la 
media de la diferencia en los puntajes antes y despues de la capacitacion es: 


Intervalo para la diferencia entre 
medias; observaciones pareadas 


— S d 

I.C. para = a ± t 


[9.11] 


= -0.5 ± (1.833) 


0.736 

vTo 


-0.927 < n d < -0.073 

Debido a que se restaron los puntajes posteriores al entrenamiento de los puntajes anteriores al entrenamiento, 
produciendo valores negativos, se puede estar 90% seguro de que la media de los puntajes posteriores al 
entrenamiento esta entre 0.073 puntos y 0,927 puntos mas alto. 


Ejemplo 9.4 

Vicki Peplow, directora regional de pagos de asistencia medica para Aetna Insurance, en Peoria, 
Illinois, constato que dos hospitales diferentes parecian cobrar cantidades ampliamente diferentes 
por el mismo procedimiento medico. Ella recolecto observaciones sobre costos de facturacion para 
15 procedimientos identicos en cada hospital, y construyo un intervalo de confianza del 95% para 
la diferencia entre los costos promedio presentados por cada hospital. Se utilizaron muestras 
pareadas porque Vicki corrigio todos los demas factores relevantes distintos al costo. 

Si existe una diferencia, La senora Peplow planea reportar este asunto a las autoridades de 
asistencia medica Medicare. ^Debera ella presentar el informe? 


Hospital 1 

Hospital 2 

d. 

d 2 . 

465 

512 

-47 

2,209 

532 

654 

-122 

14,884 

426 

453 

-27 

729 

543 

521 

22 

484 

587 

632 

-45 

2,025 

537 

418 

119 

14,161 

598 

587 

11 

121 

698 

376 

322 

103,684 

378 

529 

-151 

22,801 

376 

517 

-141 

19,881 


(Continua) 
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Hospital 1 

Hospital 2 

d. 

d 2 

1 

524 

476 

48 

2,304 

387 

519 

-132 

1 7,424 

429 

587 

-158 

24,964 

398 

639 

-241 

58,081 

412 

754 

-342 

116,964 



-884 = Zct 

400,716 = Sc/f 


Solucion 


Dados los datos anteriores se tiene que: 


d 


S4 -884 
n ~ 15 


-58.93 


- nd 2 / 400.716 - (15)(-58.93) 2 
n - I " V 15-1 


= 157.8 


I.C. para /x, — /a 2 = d ± ( t)s d /Vn 

= -58.93 ± (2.145) 157.8 /vT5 
= -58.93 ±87.4 


- 146.33 < jjb 1 — jjL 2 — -28.47 


Interpretation 

Debido a que resultaron valores con signos contrarios cuando se restaron los cargos del segundo 
hospital de los del primer hospital, Vicki puede estar 95% segura de que los hospitales estan 
cobrando aproximadamente lo mismo por los mismos servicios. Un reporte para los administradores 
de la asistencia medica apropiados no parece adecuado. 


La figura 9.2 ayudara a decidir que formula y que metodo deberfan utilizarse en la construccion de estos 
intervalos. 


Figura 9.2 

Calculo de los 
intervalos para 
la diferencia entre 
dos medias 
poblacionales 



(X l -X 2 )±t\/-± + 
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Ejercicios de la seccion 


13 . Rankin Associates recibira licitaciones de dos empresas constructoras para un trabajo de remodelacion en su 
oficina principal. La decision sobre cual oferta aceptaran dependera en parte de los tiempos promedio de termination 
de contratos similares de cada compania. Se han recolectado y agrupado por pares los datos para varios 
trabajos de remodelacion. Con base en un nivel de confianza del 99%, ^cual compania recomendarfa usted? 


Compania 1 Compania 2 Compania 1 Compania 2 


10.0 

9.2 

12.5 

7.2 

12.2 

10.0 

7.3 

8.4 

15.3 

9.2 

9.4 

10.5 

9.6 

10.5 

8.7 

6.2 

8.6 

9.5 

9.1 

8.1 

9.4 

8.4 




14 . En su ultimo viaje a Las Vegas, Lucky Louie jugo 1 5 juegos de blackjack en el casino del hotel Golden Nugget, 
y 15 juegos en el del hotel Flamingo. Para comparar sus ganancias promedio, Louie resto su “producto” del 
Flamingo del “producto” de el Nugget y encontro que Xd = 40 y YA'f = 415. Utilizando un intervalo de 
confianza del 95%, ^en que lugar deberfa jugar con mas frecuencia Louie si desea maximizar sus ganancias 
promedio? 

15 . La maratbn anual se realizara este fin de semana. Usted ha registrado su tiempo durante el transcurso de las 

ultimas cinco carreras utilizando dos tipos de tenis para correr. Dispuesto a ganar la carrera este ano, usted desea 
estimar la diferencia en sus tiempos promedio utilizando estos dos tipos de zapatos deportivos. A1 restar los 
tiempos que usted registro utilizando SpeedBurst Shoes de los tiempos que registro utilizando los zapatos 
RocketMaster obtuvo en minutos: = 8 y = 24. A un nivel de confianza del 90%, ^cual zapato prefiere? 

16 . Como analista de inversion usted debe comparar los rendimientos promedio de dos tipos de tftulos que su 
cliente esta interesado en comprar. Los siguientes datos son sobre 12 titulos de cada tipo. /,Que recomendacion 
haria con base en un intervalo de confianza del 99% sobre la diferencia entre los rendimientos promedio de 
cada tipo de tftulo? Se asume que las observaciones son pareadas. 


Titulo 1 Titulo 2 Ti'tulo 1 Titulo 2 


17 . 


3.21% 

6.390/0 

6.580/0 

4.580/0 

6.50 

8.69 

4.58 

4.00 

8.25 

7.89 

7.80 

7.80 

9.32 

9.58 

4.60 

9.88 

5.26 

6.57 

5.89 

6.58 

4.58 

7.48 

6.66 

7.89 


Los salarios mensuales iniciales, en miles de dolares, para 12 graduados en administration de la Tech U, se 
comparan con los de la State U, utilizando los datos que aparecen a continuation. Desarrolle e interprete un 
intervalo del 95% para hallar la diferencia en los salarios promedio iniciales obtenidos al restar los salarios de 
State U de los de Tech U. 


Tech 

State 

Tech 

State 

3.7 

5.6 

2.5 

8.8 

3.6 

6.8 

3.5 

9.5 

5.2 

8.5 

3.9 

7.5 

1.2 

6.5 

8.2 

6.5 

1.6 

5.5 

4.5 

4.5 

5.2 

4.8 

1.2 

8.7 
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18 . Utilizando los datos del problema anterior, calcule e interprete el intervalo del 95% para hallar la diferencia en 
los salarios promedio obtenidos al restar los salarios de Tech de los de State. ^Que diferencias encuentra? 


9.4 Intervalos de confianza para la diferencia 
entre dos proporciones 

A veces surgen situaciones en las cuales es necesario comparar las proporciones de dos poblaciones diferentes. 
Las empresas continuamente analizan la proporcion de productos defectuosos producidos por metodos diferentes. 
Investigaciones medicas se interesan en la proporcion de hombres que sufren de ataques al corazon en oposicion 
al porcentaje de mujeres. En general, muchos asuntos comerciales estan determinados mediante la estimation de 
proporciones relativas de dos poblaciones. 

El procedimiento ya deberfa ser familiar para usted. El error estandar de la diferencia entre dos proporciones 
muestrales (p { - p 2 ) se estima mediante la formula: 


Error estandar de la diferencia 

entre dos proporciones muestrales s i’~ p i ~ V 

(piO - />i) , ftO - ft) [ 91 o] 

n \ n 2 

El termino s Pl . P2 reconoce que si se tomaran varios pares de muestras de cada poblacion (p { - p 2 ) variarfa. La 
formula (9.12) tiene en cuenta dicha variacion. El intervalo de confianza es: 

Intervalo para la diferencia entre 

r l.C. para tt } 

proporciones poblacionales 

~ ^2 = (ft “ ft) ± ( Z \- P} [9-13] 


Una empresa realiza un estudio para determinar si el ausentismo de los trabaj adores en el tumo del dfa es 
diferente al de los trabajadores del tumo de la noche. Se realiza una comparacion de 150 trabajadores de cada 
tumo. Los resultados muestran que 37 trabajadores diumos han estado ausentes por lo menos cinco veces 
durante el ano anterior, mientras que 52 trabajadores noctumos han faltado por lo menos cinco veces. ^Que 
revelan estos datos sobre la tendencia al ausentismo entre los trabajadores? Calcule un intervalo de confianza del 
90% para la diferencia entre las proporciones de trabajadores de los dos tumos que faltaron cinco veces o mas. 


Pi 


P\~Pi 


37 

150 


= °.25. ft -1-0.35 


(0.25X0.75) (0.35X0.65) 


150 


150 


= 0.0526 

I.C. para -tt, - tt 2 = (p t - p 2 ) ± ( Z)s p _ Pi 

= (0.25 - 0.35) ± (1.65)(0.0526) 


= -0.10 ± 0.087 
-18.7% < (it, - t r 2 ) £ -1.3% 


Debido a que la proporcion de trabajadores noctumos que se ausentaron cinco veces o mas (p 2 ) se resto de 
la proporcion de trabajadores diumos que se ausentaron, la empresa puede estar 90% segura de que la proporcion 
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de trabajadores noctumos ausentes en cinco o mas oportunidades esta entre 1.3% y 18.7% mas alta que los del 
tumo diumo. 

El ejemplo 9.5 proporciona otro panorama de una estimacion por intervalo para la diferencia entre 
proporciones. 


Ejemplo 9.5 

Su empresa utiliza dos maquinas diferentes para cortar los disfraces Spandex que utilizan los 
actores de la obra musical Ice Capades. Se han presentado problemas en cuanto al ajuste apropiado, 
debido al funcionamiento de las maquinas. Como director de control de calidad su trabajo es 
estimar la diferencia en la proporcion de defectos producidos por cada maquina. Se tomaron muestras 
de tamanos n { - 120 y n 2 = 95: la primera maquina produjo 38% de defectos y la segunda, 43% de 
defectos. Fijar a en el 5%. Si la evidencia sugiere que la diferencia en la proporcion de defectos 
excede del 5%, todos los disfraces se produciran en la maquina que parezca tener una tasa de 
defectos menor. i Que decision tomara usted? 

Solucion 


P\~Pz 


(0.38X0.62) (0.43X0.57) 


120 


95 


= 0.0674 


LC.para tt 1 - tt 2 = (0.38 - 0.43) ± (1.96)(0.0674) 
= “0.05 ± 0.1321 
= -0.1821 < (tt ! “ tt 2 ) <0.0821 


Interpretation 

Usted puede estar 95% seguro de que la proporcion de defectos producidos por la primera maquina 
esta entre 18.21% menos y 8.21% mas que la segunda maquina. Debido a que el intervalo contiene 
cero, no hay evidencia de que exista alguna diferencia en la proporci6n de defectos producidos por 
cada una de las maquinas. Su decision es que como no hay diferencia en cuanto a cual mdquina 
utilizar, usted puede continuar utilizando ambas. 


Ejercicios de la seccion 


19. De 150 hombres y 130 mujeres, 27% y 35% respectivamente afirmaron que utilizaban tarjetas de cr6dito para 
comprar regalos de navidad. Calcule e interprete el intervalo de confianza del 99% para la diferencia entre la 
proporcion de hombres y mujeres que optaron por el credito. 

20. Los registros muestran que de 1000 estudiantes de fuera del estado, 40% fueron a casa para las vacaciones 
de primavera al tiempo que el 47% de los 900 estudiantes del estado tambi6n lo hicieron. ^Cual es el intervalo 
de confianza del 95% para la diferencia en la proporcion de estos estudiantes que fueron a casa? 

21. De los 50 estudiantes graduados 10 fueron a un clima c£lido para las vacaciones de primavera, mientras que 
24 de los 75 no graduados hicieron lo mismo. Construya el intervalo del 95% de confianza. 
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9.5 Selection del tamano apropiado de la muestra 

Con frecuencia es necesario determinar el tamano apropiado de una muestra para realizar determinado estudio. A1 
igual que con una poblacion aislada, el tamano de la muestra requerido depende de: 1) las varianzas poblacionales, 
y 2) el grado de exactitud deseado. Esta section analiza como determinar el tamano apropiado de la muestra para 
los estudios que involucran tanto medias como proporciones. 


A. Tamano de la muestra para estimar ^ - ju 2 

El tamano apropiado para la muestra se halla mediante la formula (9. 14): 


Tamano de la muestra para _ Z 2 (o~ 2 + erf) 

la diferencia entre medias poblacionales (error) 2 


[9.14] 


La Comision de Planeacion Economica de Texas ( Texas Economic Planning Commission) pidio a un economista 
de la Universidad de Texas, en Arlington, que desarrollara un intervalo de confianza del 99% para la diferencia 
entre la duration promedio del servicio prestado por empleados publicos y el de los trabaj adores del sector 
privado. La comision desea un ancho de intervalo de tres anos. Las muestras piloto produjeron varianzas de 15 y 
21, respectivamente. ^Que tan grandes deberfan tomarse las muestras de cada poblacion? 

Debido a que el intervalo es de 3 anos, el error es de la mitad de dicha cifra, o 1.5 anos. Entonces: 

(2.58) 2 (15 + 21) 

* (L5) 2 

= 106.5, o 107 mujeres 

Por tanto, 107 empleados deberfan seleccionarse del sector publico y 107 deberfan seleccionarse del sector 
privado para hacer la comparacion. 


B. Tamano de la muestra para estimar je, - n 2 

El tamano correcto de la muestra para estimar la diferencia entre dos proporciones poblacionales se halla mediante 
la formula (9.15): 


Tamano de la muestra para 2f , _ 

la diferencia entre proporciones n = — — 1 — — [9.15] 

poblacionales (error) 


Wally Simpleton, el candidate Hder en la carrera por la gobemacion, desea desarrollar un intervalo de confianza 
con un ancho de 3 puntos porcentuales y un nivel de confianza del 99% para hallar la diferencia entre la proporcidn 
de hombres y de mujeres que estan a favor de su candidatura. ^Qud tan grandes deberfan ser las muestras? Una 
muestra piloto para hombres y mujeres reveld que p h i 0.40 y p m = 0.30. Si el ancho de intervalo es 0.03, el error es 
0.03/2=0.015. 

= (2.58) 2 [(0.4)(0.6) + (0.3X0.7)] 
n (0.015) 2 

= 13,312hombresy 13,312mujeres 
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9.6 Pruebas de hipotesis para dos medias con muestras 
independientes 

Las pruebas de hipotesis para diferencias entre las medias siguen un procedimiento parecido al de los intervalos 
en que las muestras son o bien 1) independientes o 2) pareadas. Sin embargo, en este caso, a diferencia del caso 
de la estimacion por intervalo, no se esta interesado en el tarnano de la diferencia en las medias, sino solo en si 
existe o no una diferencia. Por ejemplo, una prueba de dos colas se expresarfa como: 

H„-. Mi = M2 
H a : Mi * M 2 

o el equivalente 

H„: Mi - M 2 = 0 
h a- Mi “ M 2 * 0 

Esta seccion analiza las pruebas con muestras independientes tanto para muestras grandes como para muestras 
pequenas. 


A. Pruebas con muestras grandes 

La prueba de hipotesis para la diferencia entre medias de dos poblaciones es muy parecida a la de una sola 
poblacion. Se incluyen los mismos cuatro pasos: 

1. Se plantean las hipotesis 

2. Se calcula un estadistico Zo t. 

3. Se forma la regia de decision 

4. Interpretation y conclusiones. 

El valor de Z es 





Estadistico de prueba Z 

, (AT, - X 2 ) - (m, - M 2 ) 

[9.16] 

para muestras grandes 

^1"*2 


en donde es el estimado para el error estandar de las diferencias en las medias muestrales, tal y como se hizo 
para la estimacion de intervalo. Claro que si las varianzas poblacionales son conocidas, deberfa utilizarse 

Weaver Ridge Golf Course desea ver si el tiempo promedio que requieren los hombres para jugar los 1 8 hoyos 
es diferente al de las mujeres. Se mide el tiempo de cincuenta partidos dobles de hombres y 45 de mujeres 
obteniendo 


Hombres 

Mujeres 

X = 3.5 horas 

X = 4.9 horas 

s = 0.9 horas 

s = 1.5 horas 


Vale la pena recordar de la discusion sobre intervalos de confianza que 
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(0.9) 2 + (1.5) 2 


50 


45 


0.257 


Entonces, 


(3.5 - 4.9) - 0 
0.257 


-5.45 


Si a = 0.05, el valor crftico de Z es ± 1 .96 y la regia de decision es: 


Regia de decision: “No rechazar si Z esta entre ± 1 .96. Rechazar si Z es menor que - 1 .96 o mas 
que + 1 .96.” 

Como lo muestra la figura 9.3, la hipotesis nula se rechaza. Debido a que la hipotesis nula de igualdad es rechazada 
y* m > X h , la evidencia sugiere que las mujeres toman mas tiempo en promedio. Vale la pena notar tambien que el 
valor p relacionado con la prueba es virtualmente cero. 


Figura 9.3 

Prueba de hipotesis 
para la igualdad 
de los tiempos 

• M/j ~ f^m 

H a : n h *fx m 


Si la hipotesis nula es correcta, 
las diferencias distribuidas 
normalmente en las medias 
muestrales estan centradas 

del juego de golf 

valOT^ 

i 

1 

i 

i 

1 

1 

i 


i ! 

! I 

1 i 

1 1 

1 1 

Pm = 0 

1 

1 

1 

1 

1 

1 


-5.45 -1.96 

0 

1.96 Z 


Si con el recorrido del campo de golf se hubiera planteado como hipotesis que los hombres toman menos 
tiempo {jx h < pj, las hipotesis se plantearfan como 

H o- V h a p m 

H a- Hh < 

y se realizaria una prueba de cola a la izquierda como se observa en la figura 9.4. Si a = 0.05 se mantiene, la prueba 
de cola a la izquierda requiere un valor crftico de Z de -1 .65. El valor Z de -5.45 no cambia y de nuevo cae en la zona 
de rechazo. 


Figura 9.4 

Prueba de una sola 
cola para los tiempos 
promedios de golf 



-5.45 


- 1.65 


0 


Z 
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Ejemplo 9.6 

En el ejemplo 9.1 anterior, los gerentes del Charles Schwab construyeron un estimado de intervalo 
del 99% para la diferencia entre los niveles de competencia promedio de los dos grupos de empleados. 
El resultado fue -8.34 < (ji x - j u 2 ) < 4.40. Se supone que querfan probar la hipotesis de que las 
competencias promedio eran iguales, entonces 


Solution 


Las hipotesis son: 


Mi = M 2 
H a \ jx x * il 2 


Dados los datos del ejemplo 9.1, 


Z = 


(76 - 77.97) - 0 
2.47 


Si a = 0.01 , la regia de decision es 


-0.79 


Regia de decision: “No rechazar si Z esta entre ± 2.58. De otro modo rechazar”. 

Como lo muestra la figura, Z = -0.79, la hipotesis nula no es rechazada. Ademas, el valor p es 



Interpretation 

La evidencia sugiere que no hay diferencia en la competencia promedio de los grupos de empleados 
entrenados con los dos programas. Esta posicion se confirma por el hecho de que el intervalo 
calculado en el ejemplo 9.1 contema cero, indicando que no hay diferencia. 


La impresion en Minitab para las pruebas de Schwab se observan en la pantalla 9.1. Haga clic en Stat > Basic 
Statistics > 2-sample t. Esto dara los resultados tanto del estimado de intervalo como de la prueba de hipotesis. 
Vale la pena notar el intervalo de confianza del 99% asi como el valor t y el valor p. 


Pantalla 9.1 


Two sanple T-test and confidence interval (Prueba T con dos muestras e intervalo de confianza) 

Twosample T for Prog 1 vs Prog 2 (Prueba T con dos muestras para Prog 1 contra Prog 2) 



N 

Mean 

(Media) 

StDev 

(Desviacion estandar) 

SE Mean 
(Media SE) 

Prog 1 

45 

76.0 

13.5 

2.0 

Prog 2 

40 

77.97 

9.05 

1.4 


99% C.I. for mu Prog 1 - mu Prog 2: (-8.4, 4.6) 

[99% I.C. para mu Prog 1 - mu Prog 2: (-8.4, 4.6)] 

T-test mu Prog 1 = mu Prog 2 (vs not =) : T= -0.78 P=0.44 DF=77 
[Prueba T para mu Prog 1 = mu Prog 2 (contra no =) : T= -0.78 P=0.44 


DF - Grados 

de liber tad 


DF=77 ] 
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B. Pruebas con muestras pequenas: La distribution t 

De la misma manera que en el caso de los intervalos de confianza, las pruebas que involucran muestras pequenas 
dependen de si las varianzas poblacionales pueden asumirse como iguales, o si permiten datos mancomunados. 
Si se permite la suposicion de varianzas iguales, la prueba t se vuelve 



f (X, - X 2 ) - (/X, - 


Prueba de hipotesis con muestras 

/ 2 _2 

[9.17] 

pequenas cuando = a\ (desconocidas) 

\ n } n 2 


Regresando al ejemplo 9.2, un estimado de intervalo del 98% de la diferencia en los salarios promedio de los 
trabaj adores en Atlanta y Newport News se calculo con base en 


Atlanta 

Newport New 

n =22 

n =19 

X = US$17.53 

X = US$15.50 

S 2 = 92.10 

s 2 = 87.10 


El intervalo era de - 5 .09 < ( n { - jU 2 ) <9. 1 5 . Si en lugar de un estimado por intervalo se hubiera querido realizar una 
prueba de hipotesis para medias iguales, entonces se tendrfa 

H o- Pa = Pn 
H a- Pa * Pn 


Aplicando estos datos a la formula (9.17), se tiene que 


t 


(17.53 - 15.5) - 0 

/ 89.85 89.85 

V 23 19 


= 0.69 


Dado que a es 2% y que hay 23 + 19 - 2 = 40 grados de libertad, el valor crftico de t es ± 2.423. La hipdtesis nula 
por tanto no se rechaza. Parece que no hay diferencia en el salario promedio. Esta conclusion se confirma por el 
hecho de que el intervalo contema cero. 

Si no se hace la suposicion de varianzas iguales, se tiene que 


Prueba con muestras pequenas 

r (X, - X 2 ) - (m, - p 2 ) 


1-2 -2 

[9.18] 

con varianzas desiguales 

La + £2 

V n j n 2 


t se compara con el valor crftico de t con base en los grados de libertad determinados por la formula (9.7). En 
el ejemplo 9.3, un intervalo del 98% para la diferencia en la durabilidad promedio de los dos tipos de amortiguadores 
de caucho para coches de bebe, se estimd que era 

0.5 semanas ^ ( fi } ~ fJL 2 ) ^ 7.1 semanas 

Los resultados se basaron en los datos 

X ] = 1L3 semanas X = 7.5 semanas 

n x — 13 n 2 = 10 

s { = 3.5 semanas s 2 = 2.7 semanas 
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Una prueba de hipotesis para igualdad de medias seria 

H 0 \ m, = m 2 
H a : Mi * M 2 
t es 

t = (1 1*3 ~ 7‘**) ~ 0 = 2 94 

f( 3.5) 2 { (2.7) 2 
V 13 10 

Si a = 0.02 y los grados de libertad son 20 con base en la formula (9.7), la regia de decision es 
Regia de decision: “No rechazar si t esta entre ±2.528. De otro modo rechazar”. 

Debido a que 2.94 > 2.528, la hipotesis nula de igualdad es rechazada. Dado X x > X v la evidencia sugiere que el tipo 
1 de amortiguador de caucho para coche de bebe presenta mayor durabilidad. De nuevo esta afirmacion se 
confirma con el hecho de que el intervalo del ejemplo 9.3 no contema cero. 


9.7 Pruebas de hipotesis con datos por pareados 

Las muestras por pares para realizar una prueba de hipotesis ofrecen las mismas ventajas que en la construccidn 
de intervalos de confianza. Se experimenta menos error de muestreo debido a la reduccion en la variation entre 
observaciones porque se hace la correspondence tan cerca como sea posible. 
t es 


Prueba de hipotesis para t = — — ^ ^ 

muestras pareadas ^ 


[9.19] 


en donde d es la media de las diferencias en las observaciones pareadas y s d es el error estandar de dichas 
diferencias y se halla utilizando la formula (9.10). 

En el ejemplo 9.4, Vicki Peplow preparo un estimado de intervalo del 95% para la diferencia en costos para 
procedimientos identicos en los dos hospitales. El resultado fue 

US$-146.33 < Qi x - fjL 2 ) < US$28.47 

con base en n = 15, = -884, y 2 42 = 400,716. Si la senora Peplow fuera a probar una hipotesis de igualdad, 

hallaria 

Mi = M 2 
H a : mi * M 2 


y 


- 58.93 - 0 

t = 

157.8 

VT5 


-1.44 


Dado f 05 14 = ± 2,145, la regia de decision es: 
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Regia de decision: “No rechazar si t esta entre ± 2.145, de lo contrario rechazar”. 
Esto termina en un no rechazo de la hipotesis nula. 


Ejercicios de la seccion 


22. Muestras de tamanos 50 y 60 revelan medias de 512 y 587, y desviaciones estandar de 125 y 145 
respectivamente. A un nivel del 2%, pruebe la hipotesis de que = m r 

23. A un nivel del 1%, pruebe la igualdad de las medias si muestras de tamano 10 y 8 dan medias de 36 y 49 y 
desviaciones estandar de 12 y 18, respectivamente. Se asume que las varianzas no son iguales. 

24. Responda el problema anterior asumiendo que las varianzas son iguales. 

25. Muestras pareadas de tamano 81 dan una media de las diferencias de 36.5 y una desviacion estandar de las 
diferencias de 29. 1 . Pruebe la igualdad de las medias. Sea a = 0.01 . 

26. Pruebe H 0 : m { £ m 2 si los tamanos de las muestras de 64 y 81 producen medias de 65.2 y 58.6 y desviaciones 
estandar de 2 1 .2 y 25.3. Sea a = 5%. 

27. Pruebe H 0 : 3 m 2 si dos muestras de tamano 100 producen medias de 2.3 y 3.1 con desviaciones estandar de 

0.26 y 0.3 1 . Sea a = 1 %. 

28. Las muestras pareadas de tamano 25 reportaron una diferencia media de 45.2 y una desviacion estandar de las 

diferencias de 21.6. Pruebe la igualdad de las medias a un nivel del 5%. 


9.8 Una prueba para la diferencia entre dos proporciones 

Con frecuencia, en el mundo de los negocios surgen problemas que requieren de la comparacion entre dos 
proporciones de poblaciones diferentes: la proporcion de defectos producidos por un metodo, comparado con 
los producidos por un segundo metodo; o la proporcion de deudas vencidas en una empresa comparada con las 
de otra empresa. 

La prueba para medir estas proporciones es la siguiente: 


Prueba para la diferencia 

(Pi - Pi) ~ K - tt 2 ) 

[9.20] 

de dos proporciones 

S P\~P2 



en donde p { y p 2 son proporciones de exitos en las muestras y s } _ p2 es la desviacion estandar de tales diferencias. 
Se calcula con la formula (9.12) que se utilizo en la construccion de los intervalos de confianza. 

Para ilustrar, un minorista desea probar la hipotesis de que la proporcion de sus clientes masculinos, quienes 
compran a credito, es igual a la proporcion de mujeres que utilizan el credito. El selecciona 100 clientes hombres 
y encuentra que 57 compraron a credito mientras que 52 de las 1 10 mujeres lo hicieron. 

Las hipotesis son 

H q. 7 Tfj 7T m 
H/. 7 T h * 7T m 
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A un nivel del 1% la regia de decision es: 

Regia de decision: “No rechazar si - 2.58 < Z < 2.58. De lo contrario rechazar”. 


Pi Pi 


j Pi (i - Pi) + pALziA 


/ (0.57XQ.43) (Q.473)(0.527) 

V 100 + 110 


0.069 


Entonces, 


= (0.57 ~ 0.473) - 0 
0.069 

= 1.41 


Debido a que t esta entre ± 2.58, la hipotesis nula no se rechaza. El minorista no puede concluir a un nivel del 1% 
que las proporciones de hombres y mujeres que compran a credito difieren. 


Ejemplo 9.7 

Recientemente Johnson Manufacturing ha experimentado un incremento en el numero de unidades 
defectuosas. El supervisor de produccion considera que el tumo de la noche produce una proporcion 
mas elevada de defectos que los del tumo de dia: n N > n D . Para comparar la proporcion de defectos, 
se toma una muestra de 500 unidades de la produccion del tumo de dfa y revela 14 defectos. Una 
muestra de 700 unidades del tumo de la noche muestra 22 defectos. Si una proporcion mas grande 
de defectos se origina en la produccion noctuma, el supervisor pretende instituir un programa de 
capacitacidn para que los trabajadores mejoren sus destrezas laborales. i A un nivel del 5%, deberfa 
implementarse el programa? 


Solucion 

Debido a que se pensaba que los trabajadores noctumos producian una proporcidn de defectos 
mas alta, las hipotesis son 

H„: tt n < 7 t d 
H a : tt n > t t d 

y se requiere una prueba de cola a la derecha. La regia de decision es: 


Regia de decision: “No rechazar si Z < 1 .65. Rechazar si Z > 1 .65”. 

La proporcidn de defectos del tumo de la noche es p N = 22/700 = 0.03 1 y la del tumo diumo es p D = 
14/500=0.028; entonces 


S P~P2 


V 


(0.031X0.969) 

700 


+ 


(0.028X0.972) 

500 


= 0.0099 




CAPITULO 9 * Pruebas cuando se tienen dos poblaciones 253 


y 


= (°-031 Z a ° 28 ) ~ 0 

0.0099 

= 0.303 


Interpretation 

Debido a que Z es menor que 1.65, la hipotesis nula ti^<k d no se rechaza. La evidencia no es lo 
suflcientemente fuerte como para concluir que la tasa de defectos de los trabaj adores del tumo de 
la noche sea mayor que la del tumo de dia. No debe instituirse el programa de capacitacion. 


Ejercicios de la seccion 


29. Muestras de tamanos 120 y 150 produjeron proporciones de 0.69 y 0.73. Pruebe la igualdad de las proporciones 
de la poblacion al nivel del 5%. 

30. Dos muestras de tamano 500 cada una se utilizaron para probar la hipotesis de que H Q : ft <ji r Las proporciones 
muestrales son 14% y 1 1%. A un nivel del 10%, ^cual es su conclusion? 

31. Muestras de tamanos 200 y 250 revelan proporciones muestrales de 21% y 26%. Pruebe la hipdtesis de que 
H 0 : TTj >7t r Fije aal 1%. 


9.9 Comparacion de la varianza de dos poblaciones 
normales 

Varias de las pruebas estadfsticas discutidas anteriormente parti'an de la suposicion de varianzas poblacionales 
iguales. En su momento se pidio aceptar a ciegas esta igualdad, con la promesa de que posteriormente se 
demostrarfa como probarlo. Pues el momento ha llegado: esta seccion demuestra como determinar si la suposicion 
de varianzas iguales es razonable. Esta prueba se basa en la distribution F, la cual fue denominada asf en 1924 en 
honor a Sir Ronald A. Fisher ( 1 890- 1 962). 

Cuando se comparan las varianzas de dos poblaciones, se toma una muestra de cada poblacion. Las varianzas 
de la muestra sirven como estimados de sus varianzas poblacionales respectivas. Una distribuci6n F se forma por 
la raz6n de estas dos varianzas muestrales. La raz6n F es 


Razon Futilizada para comparar f = — 

dos varianzas poblacionales s 2 s 


[ 9 . 21 ] 


en donde s 2 L es la m£s grande de las dos varianzas muestrales y s 2 s es la m£s pequena de las dos varianzas 
muestrales. 

Se asume que la varianza de la segunda muestra excede la de la primera. En ese caso, la razdn F es F = s 2 2 /s\. 
Entre mds exceda ^ a s], menos probable es que a \ = G \ y mas grande sera la razdn F. Por tanto, un valor F grande 
conllevara a un rechazo de la hipdtesis nula H Q \ a\- a 2 r 

Manipular la razdn F para garantizar que la varianza de la muestra mds alta se coloque en el numerador 
asegurard que el valor F siempre sea mayor que 1 . Vale la pena destacar en la figura 9.5 que la distribucidn F no es 
simdtrica y estd limitada por cero en el extremo inferior. 
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Debido a que la razdn F esta restringida para exceder siempre de 1 , resulta s61o una zona de rechazo en la cola 
derecha. Esta prohibida toda zona de rechazo que hubiera aparecido de otro modo en la cola izquierda. Por tanto, 
solo la mitad del area bajo la distribucion es accesible como zona de rechazo y, es necesario dividir por 2 el valor 
a seleccionado e identificar una zona de rechazo unica en la cola derecha, con un area igual a a / 2 tal como aparece 
enlafigura9.5. 


Figura 9.5 

Distribucion F 



El valor a Cuando se controla la razon Fpara asegurar que F> 1 ; se realiza la prueba 
de dos colas de la hipotesis H 0 : a] = a\ como si fuera una prueba de una cola. Por 
tanto, es necesario dividir por 2 el valor a. 


Se supone que se escogio originalmente un valor a del 10%. Dividir por 2, a 1 2 = 0.05, requiere que se consulte 
la section de la tabla G (apendice III) que pertenece a un a del 5%. Ademas, la distribucidn F tiene dos grados de 
libertad: uno para el numerador, el cual es igual a n { - 1 y otro grado para el denominador, el eual es igual a n 2 - 1 , 
en donde n Y y n 2 son los tamaiios de las muestras en el numerador y en el denominador, respectivamente. La 
notacion convencional para el valor crftico de F es F ^ u v 

Un consultor gerencial desea probar una hipotesis respecto a dos medias poblacionales. Sin embargo, antes 
de hacerlo debe decidir si hay alguna evidencia que sugiera que las varianzas poblacionales son iguales. A1 
recolectar sus datos, el consultor encuentra que: 



Muestra 1 

Muestra 2 

Tamano muestral 

10 

10 

Desviacion estandar 

12.2 

15.4 

Varianza 

148.84 

237.16 


El desea probar 

H- aj = <y\ 

H a : erf cr\ 

Utilizando la formula (9.21), y asegurandose de que la varianza mas alta estd en el numerador, se encuentra que 



= (I5 - 4 ) 2 

(12.2) 2 

= 1.59 




CAPITULO 9 • Pruebas cuando se tienen dos poblaciones 255 


Si a se fija al 5%, F . Q5/2 9 9 = 4.03. Esto se encuentra en la tabla G (apendice III) localizando dicha section de la tabla 
que tiene que ver con un a de 0.05/2 = 0.025. Se mueve hacia la fila superior para hallar 9 grados de libertad para 
el numerador y luego se baja en la columna 9 grados de libertad para hallar el denominador. Alii se encontro el 
valor 4.03 . Como se muestra en la figura 9.6. 

La regia de decision es: “No rechazar si F< 4.03. Rechazar si F> 4.03”. 

Debido a que F - 1 .59 < 4.03, la hipotesis nula H Q : a\ = a\ no se rechaza. El consultor puede proceder con la prueba 
de hipotesis respecto a las medias poblacionales bajo la suposicion de que las varianzas son iguales. 


Figura 9.6 

Distribution F 

para la igualdad 
de varianzas 


Hq‘‘ cr { 2 - cr 2 2 
H A :a x 2 *<r 2 2 


El valor a de 5% se divide 



Problemas resueltos 

1. Etica del Trabajo de los Yuppies (The Yuppies' Work Ethic) Unaemision del mes de abril de 1991 de la revista 
Fortune contaba una historia sobre los adictos al trabajo nacidos despues de la Segunda Guerra Mundial, 
entre los 25 y 43 anos de edad, que ternan trabajos en el area administrativa. El articulo comparaba la vida 
laboral de estos ejecutivos jdvenes que se habian ubicado en la via rapida corporativa, con las de los 
trabajadores quienes dedicaban menos tiempo a su trabajo. A pesar de que quienes estaban orientados hacia 
el exito reportaron con mayor frecuencia 70, 80 o incluso 90 horas semanales en el trabajo, aproximadamente 
60 horas era lo tipico. Los datos se recolectaron de las entre vistas hechas a empleados corporativos. Sea el 
grupo 1 los que se ubican en la via rapida y el grupo 2 los que pasan menos tiempo en el trabajo. Se asume que 
las entrevistas revelaron las siguientes estadisticas respecto a los horarios de trabajo semanales. 


Grupo 1 


Grupo 2 

X } = 62.5 horas 


= 39.7 horas 

s 1 = 23.7 horas 

S 2 

= 8.9 horas 

n y = 175 

n 2 

= 168 


Haga e interprete un intervalo del 90% para la diferencia en las horas promedio de trabajo y pruebe la 
hipdtesis de medias iguales a un nivel del 10%. 

Solution 

Dado 




K23J) 2 (8.9) 2 


175 


168 


= 1.92 
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Entonces, 

I.C. para (/ jl x - fx 2 ) = (X { - X 2 ) ± 

= (62.5 - 39.7) ± (1.65X1.92) 

19.63 < (*t, - n 2 ) < 25.97 

Usted puede estar 90% seguro de que quienes van en la via rapida trabajan un promedio de 19.63 horas a 
25.97 horas mas. 

La prueba de hipotesis es 


H o : Mi = M2 

H a \ Mi * M 2 


Z = 


(62.5 - 39.7) - 0 
1.92 


11.88 


La regia de decision es: “No rechazar si Z esta entre ±1.65. De lo contrario rechazar”. 


Debido a que Z = 1 1.88 > 1.65, la hipotesis nula se rechaza. 

2. Inflacion y poder del mercado Muchos estudios economicos se concentran en las industrias en las cuales 
una buena parte del poder de mercado se concentra en manos de solo unas pocas empresas. Se teme que las 
empresas poderosas de las industrias de tan alta concentration dominen el mercado para su propio beneficio. 
Fueron pareadas empresas en nueve industrias con empresas, en un numero igual de industrias, en las cuales 
el poder economico estaba mas disperso. Se equipararon las industrias de cada grupo con respecto a la 
competencia extranjera, estructuras de costos y otros factores que pueden afectar los precios de la industria. 
Los incrementos promedio en precios en los porcentajes de cada industria aparecen en la siguiente tabla. A 
un nivel del 10% ^parece que las industrias concentradas presentan presiones inflacionarias mas pronunciadas 
que las industrias menos concentradas? Haga el intervalo apropiado y pruebe la hipotesis apropiada. 


Pares 

de industrias 

Industrias 
concentradas (%) 

industrias 

menos concentradas (%) 

d 

/ 

d 2 i 

1 

3.7 

3.2 

0.5 

0.25 

2 

4.1 

3.7 

0.4 

0.16 

3 

2.1 

2.6 

-0.5 

0.25 

4 

-0.9 

0.1 

-1.0 

1.00 

5 

4.6 

4.1 

0.5 

0.25 

6 

5.2 

4.8 

0.4 

0.16 

7 

6.7 

5.2 

1.5 

2.25 

8 

3.8 

3.9 

-0.1 

0.01 

9 

4.9 

4.6 

0.3 

0.09 




~Z0 

442 


Solucion 


lid? - nd 2 = kA2 - 9(0.22X 

n- 1 ~ V 8 


= 0.706 
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I.C.para (jj, { - fi 2 ) ^ d ± t~ 

- 0.22 ± (1.860) 


0.706 

V9 


-0,218 < m^ 0.658 

Se esta 90% seguro de que el incremento promedio en precios de las industrias menos concentradas es de 
0.658% mas bajo a 0.218% mas alto. 

La prueba de hipotesis es: 

Mi = M 2 
H a : Mi * M 2 

t = ^ ~ (Mi "" M 2 ) = 0-22 - 0 
s A 0.706 




V9 


= 0.935 


La regia de decision es: “No rechazar si t esta entre ± 1 .860. De lo contrario rechazar”. 

Debido a que 0.935 < 1 .860, no se reehaza la hipotesis nula. 

3. Pruebas t con muestras pequenas Una companfa de perforacion prueba dos brocas de barrena calando a un 
maximo de 1 12 pies y registrando el numero de horas que tom6 el procedimiento. La primera broca se utilizo 
en 12 casos, resultando un tiempo promedio de2f = 27.3 horas y s } = 8.7 horas. Se excavaron 10 pozos con una 
segunda broca, produciendo un X 2 = 31.7 horas y s 2 = 83 horas. 

^Parece que una broca es mas efectiva que la otra? Sea a = 0.10. Ninguna evidencia sugiere que las 
varianzas son iguales. Responda construyendo el intervalo apropiado. 

Solucion 


1 _ if Vjh + s l/ n 2i 2 
^ ( 5 l/ n l) 2 . ( S V n 2) 2 

(n { - 1 ) ( n 2 - 1 ) 

[(8.7) 2 /12 + (8.3) 2 /10] 2 _ 174.15 
' K8.7y/12] 2 + [(8.3) 2 /10l 2 8.89 

11 + 9 

= 19.59 
~ 19 


Con g.l. = 19, y a = 0.10, f = 1 .729. 


/7 st 

I.C.para (Mi ~ M 2 ) = Gu ” * 2 ) ± t* 4- ~ 


= (27.3 - 31.7) ± (1.729) 


/(8J) 2 

V 12 


,7) 2 (8.3) 2 

10 


-10.68 ^ (mi - M 2 ) ^ 1*88 

Se puede estar 90% seguro de que la perforacidn con la broca 1 se toma entre 1 .88 horas mas y 10.68 horas 
menos. 
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La prueba de hipotesis es: 


H o- M i = M 2 
H a : mi * M2 


(27.3 - 31.7) - 0 


(8.7) 2 (8.3) 2 


12 

= - 1.211 


10 


La regia de decision es: “No rechazar si t esta entre ± 1 .729. De lo contrario rechazar”. 

Debido a que t = —1.21 1 > -1 .729, no se rechaza la hipotesis nula. 

Todos los pozos fueron excavados con el mismo equipo de perforacion y en el mismo suelo. Si por este 
motivo o por cualquier otro que pueda mencionarse, la companfa de perforacion tendrfa varianzas iguales, 
(como se diferenciarfa en parte la prueba? Varianzas iguales permiten calcular: 

2 _ jOh ~ 1) + - 1) 

Sp n, + n 2 — 2 

= (8-7) 2 (12 - 1) + (8.3) 2 (10 - 1) 

12 + 10-2 

= 72.63 horas al cuadrado 

Con grados de libertad iguales a n, + n 2 - 2 = 12 - 10 -2 = 20, 1 0 1020 = 1 .725. Entonces 
I.C.para (Mi ~ ^ ~ (%i ~ ^ 2 ) - ^ 

T fl J ^2 

= (27.3 - 31.7) ± (1.725 ) 

-10.69 s ( Ml - m 2 ) £ 1-89 


4. The Credit Crunch Un estudio en Retail Management revelo que 131 de las 468 mujeres que efectuaron 
compras al por menor lo hicieron utilizando una tarjeta de credito en particular, mientras que 57 de los 237 
hombres utilizaron la misma taijeta. ^Existe evidencia que sugiera una diferencia en la proporcion de mujeres 
y hombres que utilicen esa tarjeta? Sea a = 0.05. Construya el intervalo y pruebe la hipotesis. 

Solucion 


p-pi 


= Jp£ 1 ziA + P2O - P2) 


(0.28)(0.72) (0.24K0.76) 


468 


237 


= 0.035 

I.C.para {ir m - ir h ) = (0.28 - 0.24) ± (1.96)(0.035) 
- 0.029 < ( 7 T,„ - TT h ) < 0.109 


Parece que no hay diferencia en la proporcion de hombres y de mujeres que utilizan el credito. 
La prueba de hipotesis es: 
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H n : 7 T m — IT, 


H a \ 7T m * 7 T h 
(0.28 - 0.24) - 0 
0.035 


1.14 


La regia de decision es: “No rechazar si Z esta entre ± 1 .96. De lo contrario rechazar”. 
Debido a que Z = 1.14, no se rechaza la hipotesis nula. 


Lista de formulas 

[9.1] 


(X, - X 2 ) ± Za, 


[9.2] 

[9.3] 



[9.4] 


(X, -x 2 )±z Vi; 


[9.5] 

2 s]{n i - 1) + s\(n 2 - 1) 

Sp n l + n 2 — 2 

[9.6] 

» ft j fl 2 

[9.7] 

(jr?/n, + s\in 2 Y 

(jf/«,) 2 /(«i - 1) + (Y 2 /n 2 Y/(n 2 - 

[9-8] 

V n x n 2 

[9.9] 

CLl 

II 

*IK 

[9.10] 

C T— < 

1 1 
V * 

ii 

to 5 

[9.11] 

d± t-b- 
Vn 


Intervalo de confianza para la 
diferencia entre dos medias 
poblacionales - muestras grandes 

Error estandar de las diferencias 
entre medias muestrales 

Estimation del error estandar de la 
diferencia entre medias muestrales 

Intervalo de confianza cuando las 
varianzas poblacionales son 
desconocidas 

Estimado de la varianza 
mancomunada comun a ambas 
poblaciones 

Intervalo para la diferencia entre las 
medias cuando a 2 = a 2 2 (desco- 
nocidas) 

Grados de libertad cuando las 
varianzas poblacionales no son 
iguales 

Intervalo para la diferencia entre 
medias poblacionales cuando a] ^ 
o 2 2 (desconocidas) 

Media de las diferencias; 
observaciones pareadas 

Desviacion estandar de las 
diferencias en el caso de 
observaciones pareadas 

Intervalo para la diferencia de 
medias; observaciones pareadas 
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[9.12] 

jp i0 - p i) , p 2 ( i _ Pt) 

V n x ' n 2 

Error estandar para la diferencia de 
proporciones muestrales 

[9.13] 

(p, - p 2 ) ± ( Z)s prP] 

Intervalo para la diferencia de 
proporciones poblacionales 

[9.14] 

Z 2 (cr] + al) 

(error) 2 

Tamano muestral para la diferencia 
de medias poblacionales 

[9.15] 

Z 2 [7T,(1 - 77,) + 77 2 (1 - 7T 2 )] 

(error) 2 

Tamano muestral para la diferencia 
de proporciones poblacionales 

[9.16] 

, (X, -x 2 )-(m, - M2 ) 

s x^xi 

Prueba de hipotesis para la 
diferencia de medias - muestras 
grandes 

[9.17] 

_ 0^1 X?) 0*1 ““ /x 2 ) 

M + & 

V n v n 2 

Prueba de hipotesis con muestras 
pequenas cuando c\ = c\ 
(desconocidas) 

[9.18] 

X 2 ) - 0*. - M 2 ) 

Ji 1+4 

V n x n 2 

Prueba con muestras pequenas con 
varianzas poblacionales desi- 
guales 

[9.19] 

/ s. 

CM 

■ — ' 

! 

II 

Prueba de hipotesis para 
observaciones pareadas 

[9.20] 

(pi - Pi) - (^i - w 2 ) 

S Pl~P2 

Prueba para la diferencia de dos 
proporciones 

[9.21] 

r-i 

Ss 

La razon F utilizada para comparar 
dos varianzas poblacionales 


Ejercicios del capi'tulo 

32. Un contador de una gran corporation en el centro de Estados Unidos debe decidir si seleccionar AT&T o 
Sprint para manejar el servicio telefonico de llamadas a larga distancia de la empresa. A continuacidn se 
reportan los datos recolectados para muchas llamadas utilizando ambos servicios 



AT&T 

Sprint 

Numero de llamadas 

145 

102 

Costo promedio 

US$4.07 

US$3.89 

Desviacion estandar 

US$0.97 

US$0.85 


^Que revela un intervalo del 95% sobre la diferencia en las medias poblacionales? 

33. The Metro Pet Center compara los costos telefonicos utilizando dos programas de facturacidn diferentes. 
Con el primer programa, Metro encontrd que sobre 100 semanas la facturacidn promedio fue de US$32.40, con 
5 = US$15.10. Una muestra de 150 semanas utilizando el segundo programa dio una media de US$47.30, con 
5= US$13.20. Calcule e interprete el intervalo de confianza del 95% para la diferencia entre las medias de los 
dos programas. 
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34. En un articulo sobre viajes comerciales, U.S. News & World Report afirmo que el costo promedio en una 
cadena hotelera a nivel nacional era de US$45.12 por noche, y el de una segunda cadena era de US$42.62 por 
noche. Se asume que estos estadisticos se basan en muestras de 82 y 97 respectivamente, y que las varianzas 
poblacionales de cada cadena se sabe que son 9.48 y 8.29 dolares al cuadrado, respectivamente. Usted debe 
determinar cual cadena de hoteles utilizara su compania. A un nivel del 1%, ^que le indica el intervalo de 
confianza sobre la decision? ^Hace alguna diferencia cual cadena utiliza? 

35. Se asume que los tamanos muestrales en el problema anterior son n x = 182 y n 2 = 197: 

a. Sin solucionar el problema, explique lo que le sucederfa al intervalo con estas muestras mas grandes. ^Por 
qu 6 ocurre? 

b. Solucione el problema con estas muestras m&s grandes y observe si usted estaba en lo correcto. 

36. Una emision reciente de Business Week discutia los esfuerzos realizados por una importante empresa de 
autos para determinar si cierto tipo de vehiculo soportaba el uso y desgaste del uso diario, mas que un 
segundo tipo de vehiculo. Un especialista en finanzas que se acaba de graduar de una universidad local fue 
contratado para determinar si existe alguna diferencia en la vida promedio. Ella recolecta datos sobre el 
numero promedio de meses en los que un vehiculo esta en servicio, antes que sea necesaria la primera 
reparation importante, y descubre la siguiente information: vehiculo 1 : X x = 27.3 meses, s x = 7.8 meses, y = 
82 vehfculos; vehiculo 2: X 2 - 33.3 meses, = 10.4 meses, y n 2 = 73 vehiculos. A un nivel del 2%, construya 
el intervalo de confianza e interprete los resultados. 

37. El profesor James desea estimar la diferencia en el tiempo promedio que requieren dos organizaciones para 
decidir sobre las solicitudes de becas presentadas a ellas. Si 14 solicitudes de becas a la Fundacidn Nacional 
de Ciencias {National Science Foundation - NSF) tomaron en promedio 45.7 semanas con una desviacion 
estandar de 12.6 semanas, y 12 solicitudes a Servicios Humanos y de Salud {Health and Human Services) 
presentaron valores respectivos de 32.9 y 16.8 semanas, calcule e interprete el intervalo de confianza del 90% 
para la diferencia entre las medias. Si NSF toma mas de 5 semanas mas que HHS, James planea presentar sus 
solicitudes al segundo. ^Debe hacerlo? Se asume que las varianzas son iguales. 

38. Para comparar las medias de los ingresos por ventas diarias, un minorista selecciona un tamano de muestra de 
12 semanas en una tienda, con ingresos promedio de US$125.40 y una desviacidn estdndar de US$34.50, y 
una muestra de 15 semanas de otra tienda, con una media de US$117.20 y una desviacidn estindar de 
US$2 1 .50. Calcule e interprete el intervalo de confianza del 99% para la diferencia entre las medias poblacionales. 
Sea a\ - o 2 r 

39. A un equipo administrativo se pidio solucionar 10 problemas diferentes de control de calidad que se encuentran 
comunmente en su trabajo. A un segundo equipo se le pidio solucionar los mismos problemas. Los tiempos 
de solucion en minutos que necesito cada equipo aparecen a continuation. Calcule e interprete el intervalo 
del 90% de confianza para la diferencia entre los tiempos promedio de la poblacidn que requieren los dos 
equipos. iQue puede concluir sobre la capacidad de solucion de problema relativo de los dos equipos? 


Problema Equipo 1 Equipo 2 


1 

12 

25 

2 

15 

26 

3 

14 

21 

4 

21 

23 

5 

19 

31 

6 

12 

19 

7 

25 

35 

8 

18 

28 

9 

17 

27 

10 

20 

26 
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40 . The Wall Street Journal reporto que Ford Motor Company se intereso en los salarios promedio de sus 
ejecutivos que trabajaban en el exterior en eomparacion a los que trabajaban en el estado, en el cual quedaba 
la sede principal. El salario promedio de 87 ejecutivos en el exterior era de US$78,010, con una desviacion 
estandar de US$15,700. El mismo numero de ejecutivos que trabajan en el servicio nacional revelo una media 
y una desviacion estandar de US$69,410 y US$10,012 respectivamente. Desarrolle e interprete el intervalo del 
97% para las diferencias promedio. 

41 . Sammy Shopper desea comparar los costos de 10 servicios diferentes ofrecidos por los nuevos concesionarios 
de autos en esta zona. Aqui se presentan los datos. Calcule e interprete el intervalo de confianza del 90% para 
la diferencia entre las medias poblacionales. Si la calidad del servicio es la misma, ^cual comercializador 
deberia utilizar Sammy? £o hay alguna diferencia? 


Servicio 

Consumidor 1 

Consumidor 2 

1 

US$54 

US$36 

2 

56 

35 

3 

59 

34 

4 

65 

39 

5 

62 

37 

6 

43 

32 

7 

38 

31 

8 

48 

30 

9 

46 

29 

10 

59 

45 


42 . The Wall Street Journal reporto que se habia aumentado la preocupacion respecto al ambiente en el cual el 
ganado vacuno se mantema antes del sacrificio. Supuestamente, los ambientes libres de tensiones mejoraban 
el engorde y la calidad de la came. Un criador en California del norte incluso anuncia que “lleva a su ganado 
a una vista espectacular de la costa” antes de prepararlo para llevarlo al puesto de cames en una tienda local. 
Se asume que 50 reses de las criadas en este ambiente vacacional ganan en promedio 112 libras con s = 32.3 
libras durante un perfodo dado. Durante el mismo penodo, 50 vacas con vista al matadero ganan 105.7 libras 
en promedio con s = 28.7 libras. Calcule e interprete el intervalo del 90%. 

43 . Hace varias navidades una parte de los renos de Santa Claus se sindicalizaron. Desde entonces Santa Claus 
se ha preguntado si habia diferencia en la productividad promedio de los renos sindicalizados y los no 
sindicalizados. Una muestra de 150 renos sindicalizados reportaron una produccion promedio de 27.3 juguetes 
por semana por reno, con una desviacion estandar de 8.7 juguetes. Una muestra de 132 renos no sindicalizados 
revelo una media de 29.7 juguetes por semana por reno, con 5 = 10.7. iQu6 dice un intervalo del 90% a Santa 
Claus sobre la diferencia en la produccion promedio? 

44 . Veintiseis fondos mutuos, cada uno con US$5,000 invertidos en ellos se seleccionan para hacer una eomparacion. 
De los 26 fondos, 12 estan orientados hacia los ingresos a corto plazo y produjeron un rendimiento promedio 
de US$1,098,60 (incluyendo el incremento de capital), con una desviacion estandar de US$43.20. Los fondos 
restantes son de inversion a largo plazo y orientados al desarrollo y generaron una utilidad promedio de 
US$987.60 (incluyendo los rendimientos de capital), con una desviacion estandar de US$53.40. 

a . Calcule e interprete el intervalo de confianza del 80% para la diferencia entre los rendimientos promedio 
poblacionales. No existe motivo para creer que las varianzas son iguales. 

b . iQue tamano muestral es necesario para estar 95% seguro de que el error no excede de US$10.00? 



CAPiTULO 9 • Pruebas cuando se tienen dos poblaciones 263 


45 . The Baldwin Piano Company ha argumentado durante mucho tiempo que su metodo para ensenar a la gente 
a tocar el piano es superior al de la competencia. Para estimar cualquier diferencia en el tiempo que se toma 
aprender las tecnicas basicas, usted, como nuevo analista de Baldwin, selecciona 100 estudiantes que utilizaron 
su metodo y encuentra que el tiempo promedio fue de 149 horas con s = 37.1 horas. 

Las estadisticas correspondientes a 130 estudiantes que utilizaron el metodo de la competencia fue de 186 y 42.2. 

a. A un nivel de confianza del 99%, ^que puede concluir sobre la diferencia en los tiempos promedio de 
aprendizaje? ^Parece que su compania ofrece un metodo mejor? 

b. Que tamano de muestra se necesita para estar 99% seguro de que el error no excede de 5 horas? 

46 . Mientras que laboraba como intemo practicante para una importante empresa aseguradora, un miembro 
administrative de la universidad local realizo un estudio para medir la expectativa de vida promedio de los 
alcoholicos en oposicion a quienes no bebian excesivamente. La compania considero que los costos del 
seguro se veian afectados por la corta vida de los bebedores excesivos. 

La edad promedio al morir para 100 alcoholicos fue de 63.7 anos con 5 = 17.7, mientras que 100 bebedores 
moderados y abstemios vivieron un promedio de 75 .2 anos, con ^ = 8.7. ^Como interpretarfa usted un intervalo 
de confianza del 95% para la diferencia en la vida promedio de los dos grupos? 

47 . Se realizo un experimento en la fijacion de precios por parte de una cadena nacional de equipos estereofonicos. 
Durante un fin de semana, el precio de sus mejores reproductores de discos compactos se incremento en un 
4% en 35 tiendas y se redujo en un monto similar en otras 35 seleccionadas aleatoriamente. Los cambios en 
los ingresos por ventas se notaron en cada caso. En las tiendas que incrementaron su precio, los ingresos por 
ventas de reproductores de CD incrementaron en promedio US$842, con 5 = US$217. El incremento promedio 
en los ingresos en aquellas tiendas que bajaron los precios fue de US$817 con s = US$202. El gerente de 
marketing de la firma siempre considero que un incremento en el precio aumentarfa los ingresos mas que una 
reduction en los precios (un concepto que los economistas llaman elasticidad de la demanda). ^Qu6 dice al 
gerente un intervalo del 99% sobre los incrementos promedio en el ingreso? 

48 . Una teorfa controvertida en los titulos y valores transados en las bolsas organizadas, siempre incrementan 
mas los viemes que los lunes, debido al tiempo que toman las subastas de tesorerfa. Como proyecto prioritario, 
un especialista en fmanzas en una gran universidad, selecciona aleatoriamente 302 acciones que se transan 
el viemes en la Bolsa de Valores de Nueva York y encuentra un cambio en el precio promedio de 0.375 puntos, 
con una desviacion estandar de 0.075. Las 412 acciones seleccionadas aleatoriamente en las negociaciones 
del lunes produjo un cambio en el precio promedio de - 0.25 puntos, con una desviacion estandar de 0.05. 
^C6mo cree usted que el especialista en fmanzas puede interpretar los resultados de un intervalo del 99%? 

49 . Usted se acaba de graduar de la universidad y ha sido contratado como analista en control de calidad de 
Electric Charlie’s, un gran productor de equipos de iluminacidn. Actualmente Electric Charlie’s utiliza dos 
mtiodos para producir su sistema de iluminacidn casero Bright-Spot. Para determinar si un metodo es mejor 
que otros, usted selecciona 50 sistemas de cada metodo de produccidn. Los del primer mtiodo continuan 
proporcionando luz durante un tiempo promedio de 45.5 horas, con 5 = 12.4 horas. Los producidos utilizando 
el segundo mtiodo se fundieron a un promedio de 41 .2 horas, con s = 15.3: 

a. Calcule e interprete el intervalo de confianza del 95% para la diferencia entre los tiempos de servicio 
promedio de la poblacidn. Su supervisor desea que usted haga alguna recomendacidn. <,Cu£l serfa su 
recomendacidn? 

b. Sus muestras son lo suficientemente grandes como para estar 90% seguro de que el error no excede de 
dos horas? ^De qud tamano deberia ser la muestra? 

50 . Como nuevo analista en la divisidn de andlisis financiero de una empresa con sede en Florida que fabrica jet 
skis, usted debe determinar si la empresa debena concentrar sus esfuerzos en el suministro a los clientes de 
la Costa Oeste o los de la Florida. La decisidn depended en parte de cu£l mercado paga el precio m£s alto. El 
CEO considera que el precio promedio en la Costa Oeste es mas de US$15 por encima de lo que la empresa 
puede recibir de los clientes de Florida. Utilizando estos datos, interprete para el CEO los resultados de un 
intervalo del 95%. 
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Pedidos de la Costa Oeste 

Pedidos de Florida 

Numero de pedidos 

37 

41 

Precio promedio 

US$418.10 

US$397.20 

Desviacion estandar 

73.00 

62.10 


51 . Siete naciones asiaticas reportaron un incremento promedio en el ingreso per capita del ano anterior de 
US$121.20, con una desviacion estandar de US$23.30. Nueve paises europeos informaron cifras 
correspondientes de US$111.10 y US$19.10. Calcule e interprete el intervalo de confianza del 90% para la 
diferencia entre los incrementos promedio de la poblacion en cuanto a ingresos se refiere. ^Puede concluir 
que un continente parece haber generado incrementos mas elevados que otro? No parece que las desviaciones 
estandar sean iguales. 

52. A seis economistas que trabajan para el gobiemo se les pide pronosticar las tasa de inflation para el ano 
venidero. Ocho economistas que trabajan en empresas privadas reciben la misma tarea. Los seis economistas 
del gobiemo reportan tasas del 4.2%, 5.1%, 3.9%, 4.7%, 4.9%, y 5.8%. Los ocho economistas privados 
proyectan tasas de 5.7%, 6. 1 %, 5.2%, 4.9%, 4.6%, 4.5%, 5.2% y 5.5%. ^Cual es su estimado de la diferencia en 
los pronosticos promedio de los dos grupos de economistas? Sea a 10% y se asumen varianzas iguales. 

53 . Muchos estudios sobre impacto economico se han realizado para determinar el efecto de los sindicatos 
laborales en las tasas salariales. Para manejar este importante asunto, un economista analiza 10 talleres 
agremiados en donde se encontro una tasa salarial promedio de US$22.07 y s = US$8.12. Doce talleres no 
agremiados revelan una media de US$24. 17 y s = US$9.07. Utilice un intervalo del 99% para estimar si hay 
alguna diferencia en los niveles salariales promedio. ^Deberia sindicalizarse su taller? Se asumen varianzas 
iguales. 

54 . The Wall Street Journal publico que un distributor de alimentos en el centro de Estados Unidos analizo los 
efectos de dos programas de ventas per capita en el consumo de leche. Se dijo que diez ciudades tenian una 
publicidad extensiva en television, y se registro un incremento subsiguiente en el consumo promedio diario 
de 0.25 galones y una desviacion estandar de 0.09 galones. Otras doce ciudades fueron saturadas con 
anuncios en los periodicos. Allf resulto un incremento de 0.02 galones en el consumo promedio per capita, 
con s = 0.02 galones. Si se asume que las varianzas son iguales, ^corno interpretarfa usted los resultados de 
un intervalo del 90% ? 

55 . Como director de produccion de Maxx Manufacturing, usted debe decidir cual de las dos plantas debe 
responsabilizarse de producir los corchos para el vino utilizados en Paul Masson Wineries. Esta decision se 
fundamental en los niveles de productividad. Una muestra de 67 dias en la planta de Northridge produjo una 
media de 92.2 miles de corchos por dia con s = 12.2 millones. La planta de Southridge produjo un promedio de 
89.2 millones de corchos con s = 15.4 durante 54 dias: 

a . Pruebe la hipotesis de igualdad de las medias a un nivel de significancia del 10%. 

b. iQ ue tamaho deben tener las muestras para estar 90% seguros de que el error no excede de 5,000 corchos? 

56 . Muchas decisiones financieras de las empresas se basan en los flujos de caja. Una maquina antigua que su 
empresa esta utilizando actualmente, genero un flujo de caja neto positivo promedio de US$15,600 con una 
desviacidn estandar de US$2,300 para un periodo de 18 semanas. Una nueva maquina utilizada por la 
competencia proporciond los valores respectivos de US$ 1 2. 1 00 y US$3 .400 durante un periodo de 1 3 semanas . 
Pruebe la hipotesis de igualdad de las medias a un nivel de significancia del 2%. Con base en este analisis, 
<,que recomendaria usted? Se asume a \ . 

57. Muchos paises europeos utilizan un impuesto al valor agregado (IVA), el cual es un impuesto sobre el valor 
agregado a un bien en cada etapa de su produccion. Ocho paises que utilizan un IVA sobre el consumo 
reportaron un ingreso promedio semanal per capita de US$1,142, con 5 = US$312. Diez paises que utilizan un 
IVA sobre el ingreso bruto, reportaron un impuesto semanal per capita promedio de US$1,372, con s = US$502. 
Si a = 0.05 y a x * o v ^como interpretarfa los resultados de una hipotesis p x = 
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58. El impacto de los diferentes metodos de remuneracion sobre la productividad y los niveles de satisfaction de 
los trabajadores, siempre ha sido de interes para los economistas laborales. Fortune publico que una empresa 
de productos deportivos experimento los efectos de dos metodos de remuneracion sobre la moral de los 
empleados, en una planta de Ohio. Catorce trabajadores a quienes se les pago un salario fijo presentaron una 
prueba que media la moral y obtuvieron un puntaje promedio de 79.7 con 5 = 8.2 Doce trabajadores a quienes 
se pagaba sobre comision lograron una media de 72.7 con 5 = 5.1. Sea a = 0. 1 0 y se asume cj 1 * <r 2 , ^que puede 
concluirse respecto a los meritos relativos de los dos sistemas de pago con base en la prueba de hipotesis 
resultante? 

59. El director financiero (CFO) de una de las firmas que aparece en la lista de las mejores 500 empresas de la 
revista Fortune , debe decidir que forma de financiacion es menos costosa: si la financiacion de la deuda o el 
financiamiento por venta de participation. Ella analiza las transacciones recientes del mercado de firmas 
similares a la de ella y descubre que 17 empresas que utilizan bonos (financiacion de la deuda) experimentaron 
un costo promedio del 17.3% con 5 = 3.7%, y 10 emisiones de acciones recientes (financiamiento por venta de 
participation) termino en cifras de 22.7% y 4.7%, respectivamente. Puede usted ayudarle a probar la hipotesis 
apropiada a un nivel de significancia del 5%, si a\ * a\ ^Proporciona este estudio alguna evidencia sobre 
cual es el metodo de financiacion menos costoso? 

60. B.F. Skinner, notable teorico comportamentalista, defendio el uso del refuerzo positivo para moldear las 
actitudes en el trabajo. Texaco, Inc., ha utilizado las tecnicas de Skinner. Una muestra de 45 empleados que 
recibieron este tratamiento positivo obtuvo un puntaje promedio de 5.5 sobre 10 en una prueba de actitudes, 
con s = 1.2. Sesenta empleados que trabajan en un area que no recibe refuerzo positivo obtuvo un promedio 
de 4.8 en la prueba, con 5=1.9: 

a. Calcule e interprete el intervalo de confianza del 98% para la diferencia entre las medias poblacionales. ^Los 
resultados parecen apoyar las teorfas de Skinner? 

b . ^Cuales son los tamanos apropiados para las muestras si usted desea estar 95% seguro de que el error es 
menos que 1 punto? 

61. Un contratista de plomena desea estimar la diferencia en la proportion de trabajos de construction que 
requieren una segunda visita a la obra de construction antes de finalizar el trabajo. El contratista intenta 
entregar su trabajo a la empresa de plomerfa con el nivel mas bajo de visitas repetidas. De los 50 trabajos 
terminados por Alpha Plumbing Corporation, 39 requirieron una segunda visita, mientras que Omega Plumbing 
Group hizo una segunda visita en el 67% de sus 60 trabajos. ^Que puede usted concluir sobre la diferencia en 
las proporciones de trabajos que requieren un segundo esfuerzo, con base en un intervalo del 95 %? ^,Cual 
compama deberfa utilizar el contratista, o esto hace alguna diferencia? 

62. Dos conjuntos “identicos” de 50 empleados se inscriben en dos programas diferentes de capacitacion y 
luego se les practica una prueba de aptitudes. La diferencia promedio en los puntajes es de 13.5, con una 
desviacion estandar en tales diferencias de 4.3. i Que se concluye con un intervalo del 95% sobre la relativa 
eficacia de los programas de formation adicional? 

63. Blanca Nieves compra a sus siete enanos nuevas palas para navidad. La cantidad que cada enano puede 
excavar en la mina con las palas viejas y las palas nuevas aparece a continuation. Pruebe la hipotesis 
apropiada a un nivel del 10%. ^El regalo de Blanca Nieves para sus siete pequenos amiguitos mejorara la 
production? 


Enano 

Production diaria en toneladas 

Palas vieja 

Palas nuevas 

Doc 

1.7 

1.9 

Feliz 

1.4 

1.5 

Grunon 

2.1 

2.2 

Tlmido 

1.9 

2.0 

Dormilon 

2.2 

2.2 

Tontin 

1.4 

1.5 

Estornudo 

1.9 

1.8 
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64 . En fmanzas, un mercado eficiente se define como el que adjudica fondos para el uso mas productivo. Existe 
una bibliografia considerable que esta disenada para determinar si los mercados de valores todavia son 
eficientes. Business Week recientemente aplico encuestas a los analistas financiers. De 110 analistas que 
trabajaban para empresas productoras privadas en su esfuerzo por vender los valores de sus firmas, 42 
consideraron que los mercados eran eficientes, mientras que 31 de los 75 analistas que trabajaban para casas 
de corretaje que asisten tales ventas aceptaron que los mercados eran eficientes. Pruebe la hipotesis a un 
nivel del 5%; ^hay alguna diferencia en la proporcion de estos dos tipos de analistas que aceptan el concepto 
de eficiencia del mercado? 

65 . Se va a probar dos medicinas para establecer las reacciones adversas en los pacientes. Se suministra Accura 
a 37 pacientes y se encuentra que el 25% tienen una reaccion. De las 55 personas que recibieron Tardi, el 29% 
experimento una reaccion. Sea a 1%. ^Que puede usted concluir del intervalo resultante? 

66. Muchas empresas grandes utilizan los servicios de empresas consultoras en el proceso de seleccion de 
empleados. Para probar el beneficio de tales consultores, la IBM comparo recientemente 100 empleados 
contratados a traves de su propia division de seleccion de personal, con 150 empleados contratados de 
manera menos formal. Los resultados mostraron que el 55% de los del primer grupo no avanzaron mas alia del 
nivel admmi strati vo intermedio en siete anos de trabajo, mientras que la cifra correspondiente para el segundo 
grupo fue del 60%. ^Que puede concluir sobre la diferencia en la efectividad de estos dos metodos de 
contratacion con base en un intervalo del 98 %? 

67 . Cada unidad de negocio estrategico (SBU) dentro de una companfa es responsable de desarrollar su propia 
estrategia. En dicho esfuerzo, Whirlpool Corporation fue una de las primeras compamas norteamericanas en 
enfatizar la estrategia del marketing estrategico. Un metodo comun fue el de una encuesta al consumidor. Si 
Whirlpool encontro que el 28% de los 70 hombres a quienes se les practico la encuesta dieron su aprobacion 
para electrodomesticos pintados, mientras que el 34% de las 80 mujeres lo aprobaron. iQue revela un intervalo 
del 90% sobre la diferencia entre la proporcion de hombres y mujeres que prefieren las lavadoras y secadoras 
pintadas? 

68. De 35 personas que estan en un plan de adelgazamiento, el 70% alcanzo la meta. Un segundo plan funciona 
para el 65% de las 50 personas que lo utilizan: 

a ■ £Un intervalo del 99% indica una diferencia significativa en la tasa de exito de los planes? 

b. iQue tamano han de tener las muestras para estar seguro con un nivel de confianza del 99% de que el error 
no excedera del 5 % ? 

69 . United Airlines descubre que la mitad de una muestra de 150 vuelos llegan a tiempo cuando vuelan del este 
al oeste. De 160 vuelos que van en direccion este, 72 llegan a tiempo. Sea a 10%. 

a. ^ Que dice el intervalo resultante sobre la probabilidad relativa de llegar a tiempo dependiendo de la 
direccion del vuelo? 

b • Su jefe, que en esta semana vuela por United Airlines, desea estar 90% seguro de que el error en la 
estimation no exceda del 10%. <?Que tan grandes deberian ser las muestras? 

70 . Como parte del proyecto prioritario, un especialista en mercadeo de la Universidad de North Texas State en 
Denton, Texas, encuesto en un centro comercial local a 100 hombres y 100 mujeres respecto a sus habitos en 
las compras. De los hombres, 79 dijeron que habian utilizando una tarjeta de credito para hacer compras 
superiores a US$10 en el ultimo mes, mientras que 84 mujeres admitieron hacer este mismo tipo de pago. El 
estudiante estaba intentando refutar el hecho de que es mas probable que las mujeres utilicen la tarjeta de 
credito. A un nivel del 5%, <rlo logro? Plantee y pruebe la hipotesis apropiada. 

71 . Un ensayo realizado por un especialista en ciencias de la computation en Ohio State University, titulado “Su 
chip esta por llegar”, analizo la calidad de los chips de computador fabricados por dos compamas. De 453 
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chips producidos por la compania 1 , 54 fueron defectuosos. De 3 17 producidos por la compania 2, 43 fueron 
defectuosos. Si a =0.10, ^existe evidencia que sugiera que una empresa mantiene un control de calidad mas 
estricto que la otra, con base en la prueba de la hipotesis apropiada? 

72. Denny Dimwit, un analista de valores de Your Bottom Dollar, Inc. siempre ha considerado que es mas 
probable que los bonos convertibles se sobrevaloren mas que los bonos de ingresos. De 312 bonos 
convertibles analizados el ano anterior, Denny encontro que 202 estaban sobrevalorados, mientras que 102 
de los 205 bonos de ingresos estaban sobrevalorados. ^Estos datos confirman la suposicion de Denny? Sea 
a = 0. 10, y pruebe la hipotesis. 

73. Se utilizan dos metodos de produccion para ensamblar reproductores de discos compactos. El tiempo promedio 
requerido por ambos metodos se ha estimado en 5.6 minutos aproximadamente. Sin embargo, los estudios 
parecen sugerir que las varianzas en tales tiempos difieren. Es importante mantener horarios de produccion 
similares para coordinar los itinerarios de produccion. Determine si las varianzas en los tiempos de produccion 
no son similares. Quince reproductores de discos compactos producidos por el primer metodo reportan una 
desviacion estandar de 5.4 minutos, y 17 reproductores del segundo metodo reportan una desviacion estandar 
de 4.8 minutos. A un nivel de significancia del 5%, que concluirfa usted de la prueba de la hipotesis apropiada? 

74. Se recolectan datos para determinar si hay diferencia en las varianzas de los ingresos diarios en las dos tiendas. 
Dados los siguientes datos, ^cual es su conclusion con base en una prueba de hipotesis siendo a 1 %? 


Tienda 1 

Tienda 2 

Tienda 1 

Tienda 2 

US$45.78 

US$67.89 

US$12.55 

US$34.91 

34.66 

76.45 

37.77 

56.88 

65.89 

87.12 

21.87 

45.99 

54.78 

98.65 

23.45 


98.66 

65.87 

56.98 



B PUESTA EN ESCENA 


El escenario de apertura en la seccion Escenario describid 
su trabajo como analista intemacional: usted debe comparar 
las oportunidades de inversion en Europa y Asia. Usted 
debe preparar un informe para ser utilizado por los 

directivos de la empim pa tofo «a : m\ km 

hacer la mayorfa de inversiones; la decision depended de 
varios factores. Su compania desea concentrarse en donde 
las condiciones promedio sean mas favorables con respecto 
a 1) tasas de rendimiento, 2) niveles de utilidad, 3) niveles 
de inversion, 4) tasas de crecimiento economico, y 5) 
medidas de la estabilidad polftica. Las tasas promedio de 
incumplimiento en los creditos e inversiones tambien se 
deben considerar. Las estimaciones de las diferencias entre 
estas medias tambien son criticas. 


Los datos que aparecen a continuation estan en un 
archivo llamado ABROAD en su disco de datos. Fueron 
recolectados por su seccion Andlisis de datos para los 
datos trimestrales durante los ultimos 20 trimestres. RETE 

y ^ETA son tasas de rendimiento en Europa y Asia 
respectivamente, medidas en porcentajes. De igual forma, 
INVE e INVA son inversiones en billones de dolares, PROE 
y PROA son utilidades en billones de dolares, GROE y 
GROA son tasas de crecimiento economico en porcentajes, 
LICE y LICA son evaluaciones de estabilidad polftica 
medida de 1 a 10 en la escala de Likert suministrada por 20 
analistas politicos. A cada analista se le pidio clasificar 
tanto Europa como Asia respecto a la estabilidad polftica. 
Entre menor sea la clasificacion, se determinara que los 
gobiemos extranjeros son menos estables. 
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De 25 inversiones recientes en Europa, dos 
experimentaron fallas que resultaron en una perdida total 
de todo el dinero invertido. En Asia, 27 proyectos de 
inversion presentaron siete fallas. 
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Proporcione todo el an&lisis estadistico necesario y 
una discusion completa de la interpretacion y de los 
resultados. Establezca claramente sus conclusiones y 
recomendaciones respecto al area, Europa o Asia, en la 
cual su firma debe concentrar su actividad inversionista. 
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Del escenario a la vida real 

Una visita al U.S. Census Bureau ( www.census.gov ) le ayudara a familiarizarse con el comercio exterior como 
componente de la economfa de Estados Unidos. De Census Bureau Home Page, seleccione “Subjects from A to 
Z” (Temas de la A la Z). Alii, vaya por el indice hasta “foreign trade” (Comercio exterior) y haga clic. Seleccione 
“Trade Balances with U.S. Trading Partners” (Balanzas comerciales con paises que mantienen relaciones 
comerciales con Estados Unidos) bajo la lista de caracterfsticas. Luego, bajo el encabezado Trade Balances with 
Partner Countries — Current Year (Balanzas comerciales con paises socios - Ano actual), haga clic en “Try it out” 
(Prueba) (Una version avanzada de Netscape automdticamente saltard la pagina con el paso “prueba”). Luego 
vaya al drea “Select an item” (Seleccionar un item) para el cual usted desea la balanza comercial. 

Usted podra seleccionar de una lista un pais en particular y ver sus datos mensuales sobre exportaciones, 
importaciones y balanzas comerciales con los Estados Unidos. Datos de doce meses y cifras anuales suministradas. 
Seleccione dos paises africanos, dos asiaticos y dos europeos. Analice los datos mensuales para cada pais. ^Las 
balanzas comerciales cambian frecuentemente de positivo a negativo? Anote sus observaciones y la balanza 
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comercial anual de cada pais. ^Que tan similares son las balanzas comerciales de Estados Unidos y las de los dos 
pafses africanos? ^Los dos pafses asiaticos? los dos pafses europeos? Compare las balanzas africanas, asiaticas 
y europeas tomando a la vez dos paises de diferentes areas en cada comparacion. Usted puede detectar cualquier 
patron bien sea por tamano o signo de las balanzas anuales? 

En esta misma area del sitio web tambien se encuentra disponible informacion detallada sobre los productos 
comercializados con cada pais. Mire el encabezado, Country Detail (Detalle por Pais), y luego haga clic en el ano 
m£s reciente. Allf, observe y haga clic en cada uno de los seis pafses de los cuales usted obtuvo la informacion 
sobre la balanza comercial. ^Hay diferencias notables entre los pafses respecto a los productos que comercian con 
Estados Unidos? 
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Plan del capi'tulo 

El andlisis de varianza se utiliza para probar hipdtesis sobre la igualdad de tres o mis medias poblacionales. A1 
comparar las varianzas muestrales, es posible sacar alguna conclusidn o inferencia sobre los valores relativos de 
las medias poblacionales. 


Analisis de varianza 
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En la emision del mes de junio de 1997, el U.S. News and 
World Report publico un informe de la Agenda Central de 
Inteligencia (CIA), detallando el desempeno econdmico de 
las economias mas grandes del mundo durante 1995. El 
Grupo de los Siete (G-7), denominado Cumbre de los Ocho 
desde la inclusion de Rusia, se reunio en Denver en 1997 
para discutir las formas de combatir la pobreza mundial. El 
interes se concentro en el cambio del estado de las economias 
mundiales y el establecimiento de politicas economicas y 
poKticas que promovieran el desarrollo global. 

La siguiente tabla, corapilada por la CIA, antes de la 
Cumbre del Grupo de los Siete, proporciona una lista de 
las 10 economias mas grandes del mundo con el producto 
intemo bruto real (PIB). 


E N A R I 0 

Como se han producido varios cambios de posicion 
entre las naciones durante los ultimos aflos, la discusion en 
Denver se centra en los giros del orden de la economia 
mundial. “Se planted una pregunta respecto a si habia 
alguna diferencia significativa descendente en los tamanos 
de las economias”. Los lideres de las naciones del grupo de 
los siete consideraron que los niveles de inflacion y 
desempleo enumeradas en la section “Puesta en escena” 
que se encuentra al final de este capitulo, fueron de especial 
importancia al medir el bienestar economico de una nation. 
El material presentado en este capitulo sera de gran utilidad 
al tratar estos asuntos. 


Rango 

Pais 

PIB 

(miles de millones de dolares 
de Estados Unidos) 

Rango 

Pais 

PIB 

(mites de millones de dolares 
de Estados Unidos) 

1 

Esta dos Unidos 

$7,248 

6 

Francia 

$1,173 

2 

China 

-3,500 

7 

Inglaterra 

1,138 

3 

Japon 

2,679 

8 

Italia 

1,089 

4 

Alemania 

1,452 

9 

Brasil 

977 

5 

India 

1,409 

10 

Rusia 

796 

„ 1 


10.1 Introduction 

En el capitulo 9 se contrastaron las hipotesis respecto a la igualdad de dos medias poblacionales. Infortunadamente, 
estas pruebas estaban restringidas en su aplicacion a una comparacion de solo dos poblaciones. Sin embargo, 
muchas decisiones en los negocios requieren de la comparacion de mas de dos poblaciones. Es aqui donde el 
analisis de varianza (ANOVA) es de gran utilidad. 

A NOVA esta disenada especificamente para probar si dos o mas poblaciones tienen la misma media. Aun 
cuando el proposito de ANOVA es hacer pruebas para hallar las diferencias en las medias poblacionales, implica 
un examen de las varianzas muestrales; de alii el termino analisis de varianza . Mas especificamente, el procedimiento 
se puede utilizar para determinar si cuando se aplica un “tratamiento” en particular a una poblacion, este tendra un 
impacto significativo en su media. El uso de ANOVA originado en el campo de la agricultura, en donde el termino 
tratamiento se utiliza de la misma manera que cuando se tratan varias parcelas de tierra con diferentes fertilizantes 
y se notan las diferencias en los rendimientos promedio de los cultivos. Hoy en dia el termino tratamiento se 
utiliza ampliamente, para referirse al tratamiento de los clientes respecto a diferentes despliegues publicitarios 
observando las diferencias subsiguientes en las compras promedio, o tambien al tratamiento de tres grupos de 
empleados ante tres tipos diferentes de programas de capacitacion y observando las diferencias que ocurren en 
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los niveles promedio de productividad o, en general, en toda situation en la cual se desea una comparacion de las 
medias. 

Consideremos como ejemplo el interes en medir los efectos relativos en la production de los empleados de tres 
programas de capacitacion. Estos tres tipos de formation adicional pueden ser 1) autodidactas, 2) impartido por 
computador, o 3) ensenado por un supervisor. En un estudio ANOVA, las unidades experimentales son los 
objetos que reciben el tratamiento . En nuestro ejemplo sobre capacitacion, los empleados constituyen las unidades 
experimentales. El factor es la fuerza o variable cuyo impacto en tales unidades experimentales se desea medir. En 
este caso, “capacitacion” es el factor de interes. Finalmente, los tres tipos de capacitacion constituyen los 
tratamientos, o niveles del factor, del factor “capacitacion”. 

La forma como se seleccionan los tratamientos determina si se esta utilizando un modelo de efectos fijos o un 
modelo de efectos aleatorios. El modelo descrito anteriormente sobre el programa de capacitacion para los empleados 
es un modelo de efectos fijos. Los tres programas de entrenamiento se seleccionaron o se fijaron antes de realizar 
el estudio. Se sabe cual de los tres programas se desea probar desde el comienzo del estudio. Las conclusiones del 
estudio se aplican solo a los tres programas incluidos en el estudio. 


Modelo de efectos fijos En el cual se seleccionan tratamientos especificos o se fijan 
antes del estudio. 


En contraste, se supone que Apex Manufacturing tenia muchos programas de capacitacion distintos, y 
deseaban saber si los programas de capacitacion en general tenian efectos diferentes en el desempeno de los 
empleados. Estos tres programas de capacitacion utilizados en el estudio se consideran como una muestra de 
todos los programas de entrenamiento que la firma puede utilizar. No importa cual de los tres metodos se utilice en 
el estudio para hacer la comparacion. Toda conclusion del estudio se considera aplicable a toda la poblacion de 
programas de capacitacion. Este procedimiento producirfa un modelo de efectos aleatorios. 


Modelo de efectos aleatorios En el cual los niveles ( tratamientos ) utilizados en el 
estudio se seleccionan aleatoriamente de una poblacion de niveles posibles. 


Un estudio completo de modelos de efectos aleatorios va mas alia del alcance de este texto. La intention de 
este capitulo se concentrara en los modelos de efectos fijos. 

Para la aplicacion de ANOVA son esenciales tres suposiciones: 

1. Todas las poblaciones involucradas son normales. 

2. Todas las poblaciones tienen la misma varianza. 

3. Las muestras se seleccionan independientemente. 

Si un numero de tratamientos se designa como c, el conjunto de hipotesis de prueba es 

H 0 : f± x — fi 2 — /x 3 • * • “ l^ c 
H a : No todas las medias son iguales 

La letra c se utiliza para el numero de tratamientos debido a que en una tabla ANOVA, que se vera en breve, cada 
tratamiento se especifica en su propia columna. 

Se puede argumentar que serfa posible probar la igualdad de varias medias utilizando varias pruebas t con dos 
muestras, tal y como se hizo en el capitulo 9. Sin embargo, algunas complicaciones pueden hacer que este metodo 
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no sea efectivo. Por ejemplo, si un fabricante desea comparar la production diaria promedio para tres plantas, 
puede probar los tres siguientes conjuntos de hipotesis: 

H 0 : fx l = fi 2 
h a- Mi * Ma 

y 

Ho- Mi = M3 

H a : fit * ^3 

y 

H 0 : 

H a : fx 2 * 

Si la hipotesis nula no se rechaza en cada una de las pruebas, se puede concluir que las tres medias son iguales. 

Por lo menos dos problemas surgen con este metodo. Primero, si el numero de poblaciones (plantas) se 
incrementa, el numero de pruebas requeridas sube notablemente. Si hay cuatro plantas que el fabricante desea 
comparar, el numero de pruebas individuates se duplica de 3 a 4 C 2 = 6 pruebas. Surge el segundo problema y quiza 
el mas molesto. Debido a un compuesto del valor a, el cual es la probabilidad de un error tipo I. Si se van a realizar 
estas pruebas a un nivel del 5%, y hay tres poblaciones que requieren tres pruebas de hipdtesis separadas, la 
probabilidad de un error tipo I supera el 5%. Puede calcularse como 

P ( Tipo I) = [1 - (1 - 0.05)(1 - 0.05X1 - 0.05)] 

= 1 - (0.95) 3 
= 0.1426 

Mientras que se desea probar a un nivel del 5%, la necesidad de hacer tres pruebas incremento la probabilidad del 
error tipo I mas alia de los limites aceptables. 


10.2 Analisis de varianza a una via: Diseno completamente 
aleatorizado 

Hay varias formas en las cuales puede disenarse un experimento ANOVA. Quiza el mas comun es el diseno 
completamente aleatorizado o ANOVA a una via. El termino proviene del hecho que varios sujetos o unidades 
experimentales se asignan aleatoriamente a diferentes niveles de un solo factor Por ejemplo, varios empleados 
(unidades experimentales) pueden seleccionarse aleatoriamente para participar en di versos tipos (niveles diferentes) 
de un programa de capacitacion (el factor). 

El director administrativo de una gran empresa industrial desea determinar si los tres programas de capacitacion 
distintos tienen efectos diferentes en los niveles de productividad de los empleados. Estos programas son los 
tratamientos que puede evaluar el analisis de varianza. Se seleccionan aleatoriamente 14 empleados y se asignan 
a uno de los tres programas. A1 terminar la capacitacion, cada empleado responde un examen para determinar su 
competencia. Se colocan cuatro empleados en el primer programa de capacitacion, y cinco en cada uno de los 
otros dos programas. Cada uno de estos tres grupos se trata de manera independiente como muestras separadas. 
Los puntajes de la prueba aparecen en la tabla 10.1, junto con unos cuantos calculos basicos. 

De las 15 celdas en la tabla, 14 tienen entradas. La ultima celda del primer tratamiento es una celda vacia. Una 
celda identificada como X.. en donde i es la fila y j es la columna en la cual se encuentra ubicada la celda. X 32 es la 
entrada de la tercera fila y la segunda columna. Se ve que es 81. X 51 es la celda vacia. El numero de filas en cada 
columna se indica con una r y el numero de columnas o tratamientos se indica con una c. En el caso actual, r = 5 
y c = 3. 
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Tabla 10.1 


Tratamientos 


Prueba del puntaje 

Programa 1 

Programa 2 

Programa 3 

de los empleados 

85 

80 

82 


72 

84 

80 


83 

81 

85 


80 

78 

90 


** 

82 

88 


Columna 

medias X. X^ = 80 

X 2 = 8) 

ii 

CO 

cn 


Como se observa en la tabla 10.1, la media se calcula para cada tratamiento (columna). Debido a que las 
columnas sejdentifican mediante el subfndice j\ el promedio de columnas se representa como X, Finalmente, la 
gran media X se calcula para todas las n observaciones. 



- __ 85 + 72 + 83 + • • • + 90 + 88 

A — — — — 


= 82.14 

El analisis de varianza se basa en una comparacion de la cantidad de variacion en cada uno de los tratamientos. 
Si de un tratamiento al otro la variacion es significativamente alta, puede concluirse que los tratamientos tienen 
efectos diferentes en las poblaciones. En la tabla 10. 1 se pueden identificar tres tipos o fuentes de variacion. Vale 
la pena destaear que la primera variacion es la suma de las otras dos. 

1. Existe variacion entre el numero total de las 14 observaciones. No todos los 14 empleados tuvieron el mismo 
puntaje en la prueba. Esta se llama variacion total. 

2. Existe variacion entre los diferentes tratamientos (muestras). Los empleados del programa 1 no tuvieron el 
mismo puntaje que los del programa 2 y 3. Esto se denomina variacion entre muestras. 

3. Existe variacion dentro de un tratamiento dado (muestra). No todos los empleados de la primera muestra 
tuvieron el mismo puntaje. Esto es lo que se denomina variacion dentro de la muestra. 

Es al comparar estas fuentes diferentes de variacion que se puede utilizar el analisis de varianza para probar la 
igualdad de las medias de poblaciones diversas. Toda diferencia que los tratamientos puedan tener en la 
productividad de los empleados se detectara mediante una comparacion de estas formas de variacion. 


A. Fundamentos del ANOVA 

Para determinar si tratamientos diferentes tienen efectos diferentes en sus respectivas poblaciones, se hizo una 
comparacion entre la variacion dentro de las muestras (W/S) y la variacion entre muestras (B/S). La variacion en 
los puntajes dentro de una muestra dada puede ser producida por una variedad de factores: la habilidad innata de 
los empleados en dicha muestra, la motivacion personal, los esfuerzos individuales y la destreza, el factor suerte, 
y una gran cantidad de otras circunstancias aleatorias. El tratamiento en si mismo no producira ninguna variacion 
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en las observaciones dentro de alguna muestra, debido a que todas las observaciones en dicha muestra reciben 
el mismo tratamiento. 

Es un asunto diferente con la variacidn entre muestras. La variacidn en los puntajes entre muestras (de una 
muestra a la siguiente) puede producirse por el mismo factor aleatorio que la variacion dentro de una muestra 
(motivacidn, destreza, suerte, etc.), mas toda influencia adicional que puedan tener los tratamientos diferentes. 
Puede existir un efecto del tratamiento entre muestras debido a que cada muestra tiene un tratamiento diferente. 


Efecto del tratamiento Como las muestras diferentes tienen tratamientos distintos, 
la variacion entre las muestras puede ser producida por los efectos de tratamientos 
diferentes. 


Si un efecto del tratamiento existe, puede detectarse comparando la variacidn entre las muestras y la variacidn 
dentro de las muestras. Si la variacion entre las muestras es significativamente mayor que la variacidn dentro de 
las muestras, un fuerte efecto de tratamiento est£ presente. Esta diferencia entre la variacion entre muestras y la 
variacion dentro de las muestras es precisamente lo que mide el analisis de varianza. El an&lisis de varianza es una 
relacidn de la variacion entre muestras con la variacion dentro de las muestras. Si los tratamientos diferentes 
tienen efectos diferentes, la variacidn entre muestras crecera, haciendo que la razdn aumente. Esta razdn se basa 
en la razdn F presentada en la seccidn anterior. 


La razon F tal y como se utiliza en ANOVA La razon Fes una razon de la variacion 
entre muestras y la variacion dentro de las muestras. 


De nuevo, la variacidn entre muestras puede ser producida en parte por tratamientos diferentes. La variacidn 
dentro de una muestra dada puede ser producida sdlo por factores aleatorios como la suerte, la destreza, y la 
motivacidn de los empleados. Dicha variacidn es independiente del tratamiento (ya que todas las observaciones 
dentro de una muestra tienen el mismo tratamiento) y es el resultado sdlo del error de muestreo aleatorizado 
dentro de la muestra. 


La raz6n F Cuando las medias poblacionales son diferentes, el efecto del tratamiento 
esta presente y las desviaciones entre las muestras seran grandes comparadas con la 
desviacion del error dentro de una muestra. Por tanto, el valor Faumentara, lo cual es 
una razon de la variacion del tratamiento y de la variacidn del error. 


La variacidn total es igual a la variacidn producida por los tratamientos diferentes, mas la variacidn producida 
por elementos de error aleatorios dentro de los tratamientos, como la destreza, la suerte y la motivacidn. Es decir, 

Variacidn total = variacidn del tratamiento + variacidn del error 


B. La suma de cuadrados 

El reconocimiento de estas tres fuentes de variacion permite la division de la suma de cuadrados , un procedimiento 
que es necesario para el analisis de varianza. Cada uno de los tres tipos de variacion produce una suma de 
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cuadrados. Existe: 1) la suma de cuadrados total ( SCT ), 2) la suma de cuadrados de los tratamientos ( SCTR ), y 3) 
la suma de cuadrados del error (SCE). Como era de esperarse 

SCT = SCTR + SCE 


Esto ilustra que SCT puede dividirse en sus dos componentes: SCTR y SCE. 

Se pueden utilizar estas sumas de cuadrados para probar la igualdad de las medias poblacionales. Vale la pena 
recordar del capftulo 3 que la varianza muestral se calcula asi: 


Varianza muestral 

no 

ii 

M 

jR 

1 

1 > 5.1 

S *To 

[10.2] 


n - 1 



El numerador es la suma de los cuadrados de las desviaciones de la media. De esta forma, la suma de los cuadrados 
se utiliza para medir la variacion. El denominador es el numero de grados de libertad. Esta ecuacion sirve como 
patron que puede aplicarse a la suma de cuadrados en analisis de varianza. 

SeaX la observacion /e sima en la muestra 7'esima. Por ejemplo , X 2l es la segunda observacion en la primera 
muestra. En la tabla 10. 1, X 2l = 72, X 32 = 81, X 43 = 90, y asi sucesivamente. Entonces, 


Suma de cuadrados total 

sct= Htttu-X) 2 

[10.3] 


i-\ j~ 1 



La gran media se le resta a cada una de las 14 observaciones. Las diferencias se elevan al cuadrado y se suman. 
Como lo muestra el signo de doble sumatoria en la formula (10.3), esto se hace a traves de las filas y a traves de 
todas las columnas. De allf en adelante la notation para los signos de sumatoria se elimina, en aras de la simplicidad. 
Utilizando los datos de la tabla 10.1 se tiene que: 

SCT = (85 - 82.14) 2 + (72 - 82.14) 2 + (83 - 82.14) 2 
+ (80 - 82.14) 2 + (80 - 82.14) 2 + (84 - 82.14) 2 
+ • • • (90 - 82. 14) 2 + (88 - 82.14) 2 
= 251.7 

Deberfa notarse que SCT es simplemente la variacion de las observaciones alrededor de la gran media. 

Para la suma de cuadrados de los tratamientos se tiene que: 


Suma de cuadrados 
de los tratamiento 


SCTR = Zrj(Xj - X f 


[10.4] 


El numero de observaciones o filas en cada tratamiento, r, se multiplica por las diferencias cuadradas entre la 
media de cada tratamiento, X., y la gran media. Los resultados se suman para todos los tratamientos. La formula 
(10.4) pide que se multiplique el numero de filas en la yesima columna (vale la pena recordar que j denota una 
columna) por la desviacion de la media elevada al cuadrado de dicha columna de la gran media. La tabla 10. 1 da 

SCTR = 4(80 - 82.14) 2 + 5(81 - 82.14) 2 + 5(85 - 82.14) 2 
= 65.7 

SCTR refleja la variacion en las medias de la columna alrededor de la gran media. 
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La suma de cuadrados del error se expresa como 


Suma del cuadrado del error SCE= 22(X, y - x) 2 [10.5] 


La media de un tratamiento, X., se resta de cada observation en dicho tratamiento. Las diferencias se elevan al 
cuadrado y se suman. Esto se hace para todos los tratamientos, y los resultados se suman. Utilizando los datos 
de la tabla 10.1 nuevamente, se tiene que 

SCE= (85 - 80) 2 + (72 - 80) 2 + (83 - 80) 2 + (80 - 80) 2 
Para el primer tratamiento 

+ (80 - 81) 2 + (84 - 81) 2 + (81 - 81) 2 + (78 - 81) 2 + (82 - 81) 2 
Para el segundo tratamiento 

+ (82 - 85) 2 + (80 - 85) 2 + (85 - 85) 2 + (90 - 85) 2 + (88 - 85) 2 
Para el tercer tratamiento 
= 186.0 

SCE mide la variation aleatoria de los valores dentro de un tratamiento alrededor de su propia media. 

Una revision rapida de todos estos calculos puede hacerse como 

SCT = SCTR + SCE 
251.7 = 65.7 + 186.0 

Si se confia en la aritmetica, se puede encontrar que SCE es simplemente 

SCE = SCT - SCTR = 25 1.7 - 65.7 = 1 86.0 


C. Cuadrados medios 

Como lo dice la formula (10.2) para la varianza, despues de obtener la suma de los cuadrados, cada una se divide 
por sus grados de libertad. Una suma de cuadrados dividida por sus grados de libertad produce un cuadrado 
medio. Es decir, si se divide una suma de cuadrados por sus grados de libertad, se obtiene un cuadrado medio. 

Vale la pena recordar del capitulo 7 que se definio grados de libertad como el numero total de observaciones 
del conjunto de datos menos toda “restriccion” que pueda aplicarse. Una restriccion fue todo valor que se calcula 
a partir del conjunto de datos. 

En este aspecto, se nota que al calcular SCT, se^utilizo todo el conjunto de datos de n observaciones para 
calcular un valor. Ese valor unico era la gran media X, la cual representa una restriccion. Por tanto SCT tiene n - 1 
grados de libertad. 

El calculo de SCTR involucra el uso de c = 3 medias muestrales de las cuales se puede calcular la gran media. 
Las medias muestrales por tanto se ven como puntos de datos individuales y la gran media se toma como 
restriccion. SCTR tiene entonces c - 1 grados de libertad. 

Finalmente, se calculo SCE anteriormente sumando la desviacion de n = 14 observaciones de c = 3 medias 
muestrales. Por tanto, SCE tiene n - c grados de libertad. 

Se nota que 

g.l. para SCT = g.l. para SCTR + g.l. para SCE 
n-\ =c-\ + n-c 

Como se anoto anteriormente, debido a que la suma de cuadrados dividida por sus grados de libertad produce un 
cuadrado medio, se halla la media total de los cuadrados, o cuadrado medio total, CMT 
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Cuadrado medio total 

CMT= SCT 
n — 1 

[10.6] 

el cuadrado medio del tratamiento (CMTR) es 

Cuadrado medio del tratamiento 

CMTR _ SCTR 
c - 1 

[10.7] 

y el cuadrado medio del error (CME) es 

Cuadrado medio del error 

CME = - S -^- 
n — c 

[10.8] 


Utilizando los datos de la tabla 10.1 se tiene que: 


CMT = 


SCT 

n - 1 


251.7 
14 - 1 


= 19.4 


CMTR = 

c - 1 
_ 65.7 
"3-1 
= 32.9 


CME 


SCE 

n - c 


186.0 

14-3 


= 16.9 


Estos tres cuadrados medios estan modelados a partir de la formula (10.2). Son sumas de los cuadrados divididas 
por sus grados de libertad, y como tales son varianzas. Es la razdn de las dos ultimas CMTR y CME, que se utiliza 
como base del analisis de varianza para probar la hipotesis respecto a la igualdad de las medias. Como se observo 
anteriormente, esta razon se ajusta a la distribution F, y se expresa como 


Razon Fpara una 
prueba de medias 


CMTR 


[10.9] 


CME 
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En el caso actual se vuelve 


= 32.9 
16.9 
= 1.94 

CMTR mide la variacion entre tratamientos. Si los tratamientos tienen efectos diferentes, CMTR lo reflejara a 
traves de su incremento. Entonces, la razon F en si misma se incrementara. Por tanto, si la razon F se vuelve 
“significativamente” grande porque CMTR excede a CME por una cantidad grande, se reconoce que los efectos 
del tratamiento probablemente existen. Es probable que tratamientos diferentes tengan efectos diferentes en las 
medias de sus poblaciones respectivas, y podrfa rechazarse la hipotesis nula ji { = = jx r 

El valor crftico de F que es considerado significativamente grande puede encontrarse en la tabla G (apendice 
III) igual que antes. Se asume que el CEO desea probar las siguientes hipotesis a un nivel del 5%: 

Hq : ~ M 3 

H a : No todas las medias son iguales 

Debido a que CMTR tiene c-l=3-l=2 grados de libertad y CME tiene n — c= 14-3 = 11 grados de libertad, 
el valor cntico de F que se obtiene de la tabla es F 005 2 n = 3.98. El 2 se enumera antes del 1 1 al establecer los grados 
de libertad porque CMTR esta en el numerador. 


Figura 10.1 

Los efectos 
de la capacitaeion 



La regia de decision representada en la figura 10. 1 es 


Regia de decision: “No rechazar si F < 3.98. Rechazar la hipotesis nula si F > 3.98”. 

Debido a que se calculo que el valor Fes de 1 .94 < 3.98, el CEO no deberfa rechazar la hipotesis nula. No puede 
rechazar a un nivel del 5% la hipotesis de que los puntajes de prueba promedio son los mismos para todos los tres 
programas de capacitaeion. No existe efecto significativo del tratamiento relacionado con alguno de los programas. 


D. Una tabla de analisis de varianza 

Es habitual resumir los calculos del analisis de varianza en una tabla. El formato general de la tabla de analisis de 
varianza aparece en la tabla 10.2 A), mientras que la tabla 10.2 B) contiene los valores especificos del ejemplo 
sobre el programa de capacitaeion. 

Vale la pena destacar que se enumeran las fuentes relevantes de la variacion, y el valor F de 1 .94 se muestra en 
la columna del extremo derecho. El ejemplo 10. 1 proporciona una ilustracion mas concisa del analisis de varianza. 
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Tabla 10.2 

A. La tabla de analisis de varianza generalizada 


Una tabla AN0VA 
resume los calculos 

Fuente de variacion 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

del analisis 
de varianza 

Entre muestras (tratamiento) 

SCTR 

c-1 

SCTR /(c- 1) 

CMTR/CME 

Dentro de muestras (error) 

SCE 

n-c 

SCE Un - c) 



Variacion total 

SCT 

n -1 


B. Tabla de ANOVA para los programas de entrenamiento de empleados 

Fuente de variacion 

Suma 

Grados 

Cuadrado Valor F 


de cuadrados 

de libertad 

medio 

Entre muestras (tratamiento) 

65.7 

2 

32.9 1.94 

Dentro de muestras (error) 

186.0 

11 

16.9 

Variacion total 

251.7 

13 



H:ju1 = fj.2 - /j3 

H a : No todas las medias son iguales 

Regia de decision: No rechazar si F< 3.98. Rechazar si F> 3.98. 
Conclusion: Ya que F- 1.94 < 3.98, no se rechaza la hipotesis nula. 


Ejemplo 10.1 

Robert Shade es vicepresidente de mercadeo en First City Bank, en Atlanta. Los recientes esfuerzos 
promocionales para atraer nuevos depositantes incluyen algunos juegos y premios en cuatro 
sucursales del banco. Shade esta convencido de que diferentes tipos de premios atraerfan a diferentes 
grupos de ingreso. Las personas de un nivel de ingreso prefieren los regalos, mientras que los de otro 
grupo de ingreso pueden sentirse mas atraidas por viajes gratuitos a sitios favoritos para pasar 
vacaciones. Shade decide utilizar el monto de los depositos como una medida representativa del 
ingreso. El desea determinar si existe una diferencia en el nivel promedio de depositos entre las cuatro 
sucursales. Si se halla alguna diferencia, Shade ofrecera una diversidad de premios promocionales. 

Solucion 

Aquf aparecen siete depositos seleccionados aleatoriamente de cada sucursal, aproximado al US$100 
mas cercano. Hay c = 4 tratamientos (muestras) y r ., = 7 observaciones en cada tratamiento. El 
numero total de observaciones es n =rc = 28. 

Deposito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4 


1 

5.1 

1.9 

3.6 

1.3 

2 

4.9 

1.9 

4.2 

1.5 

3 

5.6 

2.1 

4.5 

0.9 

4 

4.8 

2.4 

4.8 

1.0 

5 

3.8 

2.1 

3.9 

1.9 

6 

5.1 

3.1 

4.1 

1.5 

7 

4.8 

2.5 

5.1 

2.1 

X. 4.87 

2X, , 

n 

(5.1 +4.9 + 5.6+- + 2.1) 

2.29 

43T 

L46 


28 


= 3.23 
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Shade desea probar la hipotesis al nivel del 5% que 

H 0 - ^ 1=^2 = ^3 = A -4 

H a : No todas las medias son iguales 
Utilizando las fdrmulas (10.3) a (10.5) se tendrfa que 


SCT = SS(X, 7 -Xf 

= (5.1 - 3.23) 2 + (4.9 - 3.23) 2 + (5.6 - 3.23) 2 
+ ••• + (2.1 - 3.23) 2 


= 61.00 

SCTR = 2 r J (X ) -Xf 

= 7(4.87 - 3.23) 2 + 7(2.29 - 3.23) 2 
+ 7(4.31 - 3.23) 2 + 7(1.46 - 3.23) 2 
= 55.33 

SCE= I2tX u ~ Xjf 

= (5.1 - 4.87) 2 + • • • + (4.8 - 4.87 ) 2 
+ (1.9 - 2.29) 2 + ••• + (2.5 - 2.29) 2 
+ (3.6 - 4.3 1) 2 + ••• + (5.1 - 4.3 1) 2 
+ (1.3 - 1.46) 2 + ••• + (2.1 - 1.46) 2 
= 5.67 


Para el primer tratamiento 
Para el segundo tratamiento 
Para el tercer tratamiento 
Para el cuarto tratamiento 


Las formulas (10.7) y (10.8) para los cuadrados medios da 

55.33 
3 

18.44 
5.67 
24 

0.236 

Entonces la razon F es 

j-, CMTR 
t CME 

^ 18 - 44 
“ 0.236 

= 78.14 


CMTR = 


CME = 


Shade debe utilizar 3 y 24 grados de libertad, ya que g.l. para SCTR = 3 y g.l. para SCE = 24. Si desea 
un a de 5%, encuentra en la tabla G (apendice III) que F 0 05 3 24 = 3.01 . La tabla ANOVA resume estas 
cifras asi 
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Fuente de variacion 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrados 

medios 

Valor F 

Entre muestras (tratamiento) 

55.33 

3 

18.44 

78.14 

Dentro de muestras (error) 

5.67 

24 

0.236 


Variacion total 

61.00 

27 




H : ^1=^x2= ju3 = HA 

H a \ No todas las medias son iguales 

Regia de decision: No rechazar si F< 3.01. Rechazar si F> 3.01 
Conclusion: Debido a que F = 78.1 4>3.01 , sc rechaza la hipotesis nula. 


La prueba se representa en la siguiente figura: 



Interpretation 

Debjdo a que F = 78.14, Shade debe rechazar la hipotesis nula. Puede estar 95% seguro de que los 
depo^itos^promedio en todas las sucursales bancarias no son iguales. Si considera que los grupos 
de ingreso diferentes se sienten atraidos por tipos de juegos de promotion distintos, deberia 
disenar esquemas altemativos para que cada sucursal atraiga nuevos depositantes. 


10.3 Pruebas para la diferencia entre pares de medias 

Como se puede observar en la explication anterior, el analisis de varianza dice si todas las medias son iguales. Sin 
embargo, cuando se rechaza la hipotesis nula, el analisis de varianza no re vela cual(es) media(s) es (son) diferentes 
del resto. Se deben utilizar otras pruebas estadisticas para tomar esta determination. Estas pruebas consisten en 
una comparacion por pares, de todos los pares de medias posibles. Si el valor absoluto (ignorando los signos) de 
la diferencia entre dos medias muestrales cualquiera es mayor que algun estandar, se observa como una diferencia 
significativa, y se concluye que las medias poblacionales respectivas son diferentes. 

Se puede determinar este estandar debido a una diversidad de procedi mientos estadisticos incluyendo el 
metodo de Tukey (Too’ Key) y la diferencia minima significativa ( DMS ). 


A. Pruebas para disenos balanceados 

Tanto el metodo Tukey como el primero de los dos metodos DMS que aparecen aqui, se utilizan si existe igual 
numero de observaciones en cada muestra. Se dice que tales disenos del analisis de varianza son balanceados . 
Si el diseno no esta balanceado porque las muestras son de diferentes tamanos, debe utilizarse un metodo DMS 
altemativo (que se ilustrara en breve). 
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Disenos ANOVA En un diseno de analisis de varianza balanceado, cada muestra 
tiene el mismo numero de observaciones. Si una o mas muestras tienen un numero 
diferente de observaciones, se dice que el diseno no esta balanceado. 


En el ejemplo 10.1, el Sr. Shade descubrio que no todas las cuatro sucursales de su banco teman los mismos 
niveles de depositos. El siguiente paso logico es determinar cuales son diferentes. Debido a que hay un numero 
igual de observaciones en todas las cuatro muestras (r = 7), cualquiera de los metodos, bien sea el de Tukey o el 
DMS puede utilizarse. 

El metodo Tukey Desarrollado enl953 por J.W. Tukey, requiere el calculo del criterio de Tukey, T, como 
aparece en la formula (10.10). 


Criterio de Tukey para 

_ iCME 

1 ~ <7cr,c,n-c y 

[10.10] 

comparaciones por pares 




en donde q tiene una distribucion de rangos estudentizada con cy n - c grados de libertad y a es el valor a 
seleccionado. Vale la pena recordar que c es el numero de muestras o tratamientos (columnas), y n es el numero 
total de observaciones en todas las muestras combinadas. Estos valores son 4 y 28 en el problema de la sucursal 
bancaria de Shade. 

La tabla L (apendice III) proporciona los valores crfticos para q con a = 0.01 y a = 0.05. Si a se fija en 0.05, 
Shade desea el valor para q 005 4 24 . En la seccion de la tabla L destinada a los valores con a 5 = 0.05, se pasa a la fila 
superior para los primeros grados de libertad de 4 y se baja por esa columna hasta los segundos grados de libertad 
de 24. Alii se encontrara el valor 3.90. Entonces 

O ™ W 

= 0.716 

El criterio estandar de Tukey de 0.716 se compara entonces con la diferencia absoluta entre cada par de medias 
muestrales. Si cualquier par de medias muestrales tiene una diferencia absoluta mayor que el valor T de 0.716, se 
puede concluir, a un nivel del 5%, que sus medias poblacionales respectivas no son iguales. La diferencia entre las 
medias muestrales es demasiado grande como para concluir que proviene de poblaciones similares. Existe s61o un 
5% de probabilidad que las poblaciones con medias iguales puedan producir muestras de estos tamanos con 
medias que difieran en mas de 0.716. 


|x,- 

-x 2 | 

= 1 4.87 - 

2.29 | 

= 2.58 

> 

0.716 

|X, - 

"Xjl 

= 1 4.87 - 

4.31 1 

= 0.56 

< 

0.716 

|X, - 

-x 4 | 

= 1 4.87 - 

1.46 1 

= 3.41 

> 

0.716 

|X 2 - 

-x 3 | 

= 1 2.29 - 

- 4.31 1 

= 2.02 

> 

0.716 

|Xj - 

-x 4 | 

= 1 2.29 - 

- 1.46 1 

= 0.83 

> 

0.716 

|x 3 - 

-X 4 | 

= 1 4.31 - 

- 1.46 1 

= 2.85 

> 

0.716 


A1 comparar los valores absolutos de cada diferencia entre los pares de medias muestrales con T = 0.716, Shade 
puede estar 95% seguro que solo las sucursales 1 y 3 tienen igual nivel promedio de depdsitos. Todas las otras 
diferencias exceden el criterio T. 

Estos resultados pueden resumirse mediante el subrayado comun en el cual las lineas que conectan las medias 
muestran que 6stas no difieren significativamente. Las medias muestrales primero deben ponerse en un serie 
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ordenada, generalmente del mas bajo al mds alto, tal y como se muestra aquf. Debido a que s61o las sucursales 1 
y 3 no difieren significativamente, son las unicas que estan conectadas por un subrayado comun. 

X 4 X 2 X 3 X x 

1.46 2.29 4.31 4,87 

Diferencia minima sign ificativa El metodo de diferencia minima significativa es muy s imilar al metodo de Tukey. 
Compara el criterio de la diferencia menos significativa con la diferencia absoluta en las medias muestrales. 

Si el diseno esta balanceado, el criterio DMS es: 


Diferencia minima 
significativa 


DMS = 


2(CME)F aA '„- 

r 


[ 10 . 11 ] 


Vale la pena destacar que al utilizar el metodo DMS, F tiene lyn-c grados de libertad. En el caso de Shade esto 
es 1 y n - c = 28 - 4 = 24 grados de libertad. De la tabla F, F 00J|24 = 4.26. Entonces: 


DMS 


1 


2(0.236)4.26 

7 


= 0.536 

Al comparar la DMS de 0.536 con cada una de las diferencias absolutas que aparecieron anteriormente. Shade 
encuentra que todos los valores, incluyendo el ultimo, sugiere medias poblacionales diferentes. El metodo DMS es 
mds conservador en que, dado un conjunto de condiciones cualquiera, el criterio DMS serd menor que el valor Tukey. 

Los calculos matemdticos extensivos que necesito el andlisis de varianza puede facilitarse con el uso de 
paquetesde software modemos. Lapantalla 10.1 muestra la impresidn del ejemplo 10.1 enelcual el Sr. Shade del 
First City Bank tenia que decidir si los depdsitos promedio en cuatro sucursales bancarias eran iguales. La 
porcidn superior muestra el valor Fde 78.09, el cual se compara con el 78. 14 que se calculo manualmente. El valor 
p de 0.000 revela por que se rechazdla hipotesis nula a un nivel del 5%. 

La parte inferior de la impresion proporciona el subrayado comun. De acuerdo con el criterio de Tukey, se 
puede observar que s61o las sucursales 1 y 3 se superponen. 


Pantalla 10.1 


One-Way Analysis of Variance (Andlisis de varianza a una sola via) 


Analysis of Variance on Cl (Analisis de 

varianza en Cl) DF = Grados de 

libertad 

Source 


DF 

SS MS F 

P 

SS = Sumas de 

cuadrados 

C2 


3 

55.333 18.444 78.09 0.000 

MS = Cuadrado 

medio 

Error 


24 

5.669 0.236 


Source = Fuente 


Total 


27 

61.001 








Individual 95% 

CIs For Mean Based on 

Pooled 





StDev (ICs del 

95% para media basada 

en desvia- 

Level 

N 

Mean 

StDev 

ci6n est&ndar 

mancomunada) 


(Nivel) 


(Media) 

(Desviacidn estdndar) 

-- + + - 



1 

7 

4.8714 

0.5469 



■) 

2 

7 

2.2857 

0.4259 

(--* — ) 



3 

7 

4.3143 

0.5210 


<-*--) 


4 

7 

1.4571 

0.4392 

(--*—) 









— 

Pooled 

StDev (Desviacidn 




est&ndar mancomunada) = 0.4860 

1.2 2.4 

3.6 4.8 



MTB > 
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Con cualquiera de los metodos, pueden surgir inconsistencias. Se asume en aras de la simplicidad que hay 
solo tres poblaciones en el estudio, que requieren comparaciones por pares: 

|x,-x 3 | \x 2 -x 3 \ 

Puede encontrarse que 1 no difiere significativamente de 2, y que 2 no difiere significativamente de 3, pero que 
1 si difiere significativamente de 3. Esto parece contradictorio. Pero segun la regia de la transitividad, si 1 es igual 
a 2 y 2 es igual a 3, entonces 1 debe ser igual a 3. Sin embargo, las comparaciones por pares no involucran 
igualdades. A1 comparar las tres poblaciones, se analiza simplemente la evidencia estadfstica para determinar si es 
lo suficientemente fuerte como para rechazar la hipotesis nula. Concluir que 1 no difiere significativamente de 2 
simplemente significa que se tiene suficiente evidencia para concluir que son diferentes. Si se concluye, como se 
hizo aquf, que 1 difiere de 3, puede asumirse que la evidencia que compara estas dos muestras era mas fuerte. 


B. Pruebas para disenos no balanceados 

Si el diseno es no balancedo, el metodo de Tukey y el metodo DMS, discutidos anteriormente, simplemente no se 
aplican, en su lugar, se puede utilizar un metodo DMS altemativo. 

Metodo DMS alternative Para comparar las muestras jesima y kesima , la ecuacion para DMS se vuelve: 


Diferencia minima significativa 





DMSj' k = ^ 

ri ii 

- + — 

LO r k- \ 

(CME)F ac _ ln _ c 

[10.12] 

para el diseno no balanceado 


en donde r. es el numero de observaciones en la piuestra jesima y r k es el numero de observaciones en la muestra 
kesima. El valor DMS sera diferente para cada bar de comparaciones por pares, debido a que el numero de 
observaciones no es el mismo en cada rpuestra^ 


Ejemplo 10.2 

Cada vez mas norteamericanos buscan escapar de las presiones urbanas, los pagos impuestos en 
los parques nacionales ha demostrado un incremento marcado de quienes acampan los fines de 
semana. Outdoor World informo recientemente que el parque Yosemite National Park ubicado en 
las sierras altas de California contrato un consultor en economfa para estudiar la situation financiera 
del parque. 

Parte del esfuerzo realizado por el consultor requerfa una comparacion de los ingresos del parque 
provenientes de varias fuentes, incluyendo los pagos por acampar, licencias para pescar y para 
pasear en bote. Aquf aparecen los datos para visitantes, seleccionados aleatoriamente. Se determina 
si existe diferencia en los ingresos promedio que recibe el parque provenientes de estas tres 
actividades. 


Visitante 

Acampar 

Pesca 

Pasear en bote 

1 

US$38.00 

US$30.00 

US$19.00 

2 

32.00 

25.00 

35.00 

3 

35.00 

31.00 

20.00 

4 

36.00 

35.00 

22.00 

5 

38.00 

#* 

25.00 

6 

32.00 

** 

** 

X 

j 

US$35.17 

US$30.25 

US$24.20 
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Solucion 

Asumiendo que a se fija en 5%, entonces F ; nc = F 0052l2 = 3.89. La tabla ANOVA apareceria asi: 


Fuente de variacion 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Entre muestras (tratamiento) 

328.0 

2 

164.0 

7.74 

Dentro de muestras (error) 

254.4 

12 

21.2 


Variacion total 

582.4 

14 




H 0 :\i 1 = p2 = p3 

H a : No todas las medias son iguales 

Regia de dicision: No rechazar si F< 3.89. Rechazar si F> 3.89 
Conclusion: Rechazar la hipotesis nula ya que F= 7.74>3.89. 


Debido a que se rechaza la hipotesis nula de los ingresos promedio provenientes de todas las tres 
actividades, el consultor desearfa utilizar las comparaciones por pares para determinar cuales difieren 
del resto. Si a es 5%, F Q Q5 cl n . c =F QQ52n - 3. 89. La comparacion para la primera actividad (acampar) 
y para la segunda (pesca), utilizando la formula (10.2) para calcular DMS es: 


“ + 7 (21.2)(3.89) 
6 4 


Una comparacion entre acampar y pasear en bote revela que: 


DMSj qb = 


\ + \ (21.2)0.89) 
6 5 


V = 5.48 

La ultima comparacion entre pesca y montar en bote produce 


DMS fb = ^[1 + t](21.2)(3.S 


- 6.08 

Las diferencias entre las medias y si exceden o no su valor DMS respeetivo son 


I 35.17 - 30.251 


4.92 < 5.85 


\X C - X h \ = |35.17 ~ 24.20 1 = 10.97 > 5.48 
\X f ~~X b \ - | 30.25 - 24.20 1 = 6.05 < 6.08 

S61o acampar y montar en bote difieren significativamente. Los resultados pueden resumirse con 
un subrayado comun despues que las medias se hayan colocado en un arreglo ordenado asi. 


Interpretation 

Se puede concluir a un nivel de significance del 5% que solo montar en bote y acampar difieren 
significativamente. El parque puede utilizar esta informacion para tomar decisiones y aliviar la 
presion financiera sobre los recursos y proporcionar una experience al aire libre para los pioneros 
modemos. 
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Parece que el subray ado comun del ejemplo es auto-contradictorio. Muestra que montar en bote y pescar no 
difleren y que la pesca y el hecho de acampar no son diferentes, sin embargo montar en bote y acampar si son 
diferentes. La regia algebraica de la transitividad dice que si A igual afiyfi igual a C, ^entonces A debe ser igual 
a C? Si, pero no se esta tratando de igualdades con este ejemplo. Simplemente se dice que la diferencia entre 
montar en bote y pescar no es significativa y que la diferencia entre pescar y acampar no es significative sin 
embargo la diferencia entre montar en bote y acampar es lo suficientemente grande como para ser significativa. 


Ejercicios de la seccion 


1. Un productor de pinturas para vivienda desea comparar el factor brillo de su pintura utilizando cuatro 
emulsiones diferentes. Se pintan cinco tablas con cada tipo de emulsion y la clasificacion que se dio a cada 
una aparece aqui. 


Tablas 


Emulsion 


1 

2 

3 

4 

1 

79 

69 

83 

75 

2 

82 

52 

79 

78 

3 

57 

62 

85 

78 

4 

79 

61 

78 

73 

5 

83 

60 

75 

71 


a . un nivel del 1%, existe / algi^iajnferencia en la clasificacion promedio? 

b . Use el metodo de Tukey para probar las diferencias y determinar si el productor deberia utilizar algun tipo 
o evitar su uso? 

2. Un estudio reciente realizado por American Assembly of Collegiate Schools of Business comparo los salarios 
iniciales de los nuevos graduados en diversos campos. Una parte de sus resultados se representa en la tabla 
siguiente. A un nivel del 5%, ^parece que hay diferencia en los salarios promedio (en miles de dolares) de los 
graduados en los diferentes campos? (sistemas de information por computador-SIC, y metodos cuantitativos- 
MC.) 


Graduado 


Campo de estudio 


Finanzas 

Mercadeo 

SIC 

MC 

1 

23.2 

22.1 

23.3 

22.2 

2 

24.7 

19.2 

22.1 

22.1 

3 

24.2 

21.3 

23.4 

23.2 

4 

22.9 

19.8 

24.2 

21.7 

5 

25.2 

17.2 

23.1 

20.2 

6 

23.7 

18.3 

22.7 

22.7 

7 

24.2 

17.2 

22.8 

21.8 


3. Considerando sus resultados del problema anterior, utilice el metodo de Tukey para determinar cuales medias 
son diferentes. ^Obtiene los mismos resultados con el metodo DMS1 Mantenga a = 0.05. Resuma los resultados 
con el subrayado comun. 

4 . Una empresa de suministros medicos desea comparar la production diaria promedio de sus tres plantas en 
Toledo, Ohio; Ottumwa, Iowa; y Crab Apple Cove, Maine. Se recolectaron datos para cada sitio y aparecen 
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a continuation. un nivel del 10%, existe diferencia en las medias? Las cifras estan dadas en unidades de 
production. 

Toledo: 10, 12, 15, 18,9, 17, 15, 12, 18 
Ottumwa: 15, 17, 18, 12, 13, 11, 12, 11, 12 
Crab Apple Crove: 12, 17, 15, 15, 18, 12, 13, 14, 14 

5. Ralph trabaja como mesero para estudiar taxidermia en la universidad. Las propinas que recibio recientemente 
en tres restaurantes aparecen a continuation: 


Beef & Boar 

Sloppy Sam's 

Crazy Charlie's 

US$5.12 

US$5.60 

US$6.00 

6.18 

4.25 

5.00 

4.25 

6.25 

2.00 

5.00 

7.25 

4.50 

6.00 

5.00 

6.50 

3.25 

4.00 

5.50 


^En cual sitio deberfa trabajar si desea maximizar sus propinas, o parece no haber diferencia? Sea a = 5%. 

6. Debido a que los corredores de bolsa trabajan en su mayorfa por comision, estan interesados en la actividad 
comercial del mercado. Se realizo un estudio para determinar si habia una diferencia en las comisiones 
promedios pagadas con base en el dia de la semana, y se recolectaron los datos que se muestran aqui, en 
cientos de dolares. A un nivel del 1%, ^que dias parecen pagar mas? Utilice el criterio de Tukey. Resuma con 
el subray ado comun. ^ 


Lines 

Martes 

Miercoles 

Jueves 

Viernes 

US$21 

28 

11 

15 

25 

26 

21 

14 

14 

23 

24 

19 

12 

12 

26 

32 

15 

10 

12 

28 

25 

12 

10 

16 

24 

26 

10 

12 

13 

25 

24 

13 

15 

18 

29 


10.4 ANOVA a dos vi'as. El diseno aleatorizado en bloques 

Con el analisis de varianza a una via, se penso que solo un factor influenciaba las unidades experimentales - tal 
como los depositos en las sucursales bancarias, o los ingresos en el parque. Sin embargo, con frecuencia se 
encuentra que una segunda influencia exterior puede impactar las unidades experimentales. Por ejemplo, el 
interes puede ser comparar la productividad promedio de los tres tipos de maquinas (tratamientos). Sin embargo, 
se observa que al probar estas maquinas, la destreza del operador y su experiencia pueden afectar la production 
de la maquina, produciendo confusion sobre cual maquina es realmente mejor. Asi, para obtener un panorama no 
contaminado y claro de la capacidad de la maquina, se debe eliminar de alguna manera o corregir, la influencia del 
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operador sobre la produccion final. Esta consideracion simultanea de las dos fuerzas requiere del analisis de 
varianza a dos vias. 

Para obtener una medida decisiva de la capacidad de la maquina, se debe “bloquear” el factor extemo, 
colocando las observaciones en grupos homogeneos con base en los anos de experiencia. Asi, las observaciones 
se clasifican tanto por bloques como por tratamientos. El proposito del bloqueo es reducir la variacion dentro de 
un tratamiento (tipo de maquina). Este diseno experimental se llama diseno aleatorizado en bloques. 

Si los bloques se realizan de manera efectiva y se basan en un factor (tal como la experiencia) que verdaderamente 
afecte la productividad, se obtiene una medida mas pura del efecto del tratamiento. Sin embargo, si el factor 
seleccionado para el bloqueo no afecta la productividad (como por ejemplo el numero de seguro social del 
trabajador, el color del cabello o el sexo), los resultados pueden ser enganosos. Es importante determinar si el 
bloqueo se hace o no correctamente, y si el factor en el que se basa el bloqueo si tiene cierto impacto. 

Para ilustrar, una empresa de contabilidad grande trata de seleccionar un sistema de computacidn integrado a 
la oficina, entre los tres modelos que estan actualmente en estudio. La seleccidn final dependera de la productividad 
de los sistemas. Se seleccionan aleatoriamente cinco operadores para manejar cada sistema. Es importante tener 
en cuenta que el nivel de experiencia que tienen los empleados en el manejo de computadores puede afectar el 
resultado de la prueba. Por tanto, existe la necesidad de justificar el impacto de la experiencia al determinar los 
meritos relativos de los sistemas de computacidn. Los niveles resultantes de produccion medidos en unidades 
por hora aparecen en la tabla 1 0.3 . Un valor codificado mas alto para la experiencia indica mas anos de capacitacion. 


Tabla 10.3 

Niveles de produccion 
para los sistemas 
de computaeion 


Sistemas (tratamientos) 


Nivel de experiencia 

1 

2 

3 

X 

! 

1 

27 

21 

25 

24.33 

2 

31 

33 

35 

33.00 

3 

42 

39 

39 

40.00 

4 

38 

41 

37 

38.67 

5 

45 

46 

45 

45.33 

X, 

36.5 

36.0 

36.2 

36.27 


Dentro de una muestra dada (sistema) ocurrira una variacion en la produccion debido a la experiencia del 
operador, su competencia y su estado actual de salud, y a otros factores de error aleatorios. En el analisis de 
varianza a una via, se identified como error de variacion. Si cualquiera de estos factores aleatorios relacionados 
con los operadores afectan materialmente el nivel de produccion, la empresa de contabilidad debe corregirlos. La 
empresa puede considerar que los anos de experiencia de un operador afectan significativamente su productividad. 
Sin embargo, la empresa esta interesada en la productividad de los sistemas de computaeion, y no en la de los 
empleados. Por tanto se debe ajustar a la productividad de los empleados eliminando el efecto de variabilidad del 
operador para obtener una medida precisa, no contaminada, de la calidad del sistema. 

Con el analisis de varianza a dos vias, la suma de cuadrados total se divide en tres partes: la suma de 
cuadrados del tratamiento ( SCTR ), suma de cuadrados del error, y la suma de cuadrados de bloques (SCBL). Por 
tanto 


SCT = SCTR + SCE + SCBL 


SCT y SCTR se calculan de la misma forma que en el analisis de varianza a una via. Sin embargo SCE se subdivide 
en una medida para SCE y SCBL , en donde 


Suma de cuadrados 
de bloques 


scbl= Sc,#, - X) 2 


[ 10 . 13 ] 




CAPITULQ 10»Analisis devarianza 291 


El numero de tratamientos en cada bloque , c., se multiplica por la diferencia al cuadrado entre la media para 
cada bloque, X., y la gran media. Los resultados se suman para todos los bloques. El simbolo c. se utiliza para 
indicar el numero de tratamientos en un bloque (fila), porque los tratamientos se registran en las columnas. De la 
tabla 10.3, 

SCBL = 3(24.33 - 36.27) 2 + 3(33 - 36.27) 2 + 3(40 - 36.27) 2 
+ 3(38.67 - 36.27) 2 + 3(45.33 - 36.27) 2 
= 765.04 

La suma de los cuadrados del bloque mide el grado de variacion de las medias del bloque (fila) alrededor de la gran 
media. 

Las formulas (10.3) y (10.4) dan 


SCT= 806.93 y SCTR = 0.93 

SCE se calcula como 


Suma de cuadrados 
del error 


SCE = SCT - SCTR - SCBL 


[ 10 . 14 ] 


= 806.93 - 0.93 - 765.04 
= 40.96 

En donde hay r bloques y c tratamientos, y hay n = rc observaciones. Los grados de libertad para cada una de las 
sumas de cuadrados de los valores de la formula (10.14) son 

SCE = SCT - SCTR - SCBL 
(r - l)(c - 1) = (n - 1) - (c - 1) - (r - 1) 

(5 - 1)(3 - 1) = (15 - 1) - (3 - 1) - (5 - 1) 

8 = 14 - 2 - 4 

El cuadrado medio total y el cuadrado medio del tratamiento son, al igual que antes, la suma de sus cuadrados 
dividida por sus grados de libertad. Por tanto, 

SCT 

Cuadrado medio total = CMT — 7 

n - 1 

806,93 

14 

= 57.64 

SCTR 

Cuadrado medio del tratamiento = CMTR = r 

c - 1 

093 

2 

= 0.47 


En ANOVA a dos vfas. 


Cuadrado medio del error 


CME = 


SCE 

(r - l)(c - 1) 


[ 10 . 15 ] 






292 ESTADl'STICA APLICADA A LOS NEGOCIOS Y LA ECONOMIA 


= 40.96 
8 

= 5.1 


Cuadrado medio del bloque 


CMBL = 


SCBL 
r - 1 


[10.16] 


= 76504 
4 

= 191.26 


Tabla 10.4 

ANOVA a dos vias 
para los sistemas 
de computacion 


Fuente de variation 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Entre muestras (tratamiento) 

0.93 

2 

0.47 

0.09 

Entre bloques 

765.04 

4 

191.26 

37.50 

Dentro de las muestras (error) 

40.96 

8 

5.10 


Variation total 

806.93 

14 




Estos calculos se resumen en la tabla 10.4. Los valores F se calculan de la misma manera que en el analisis de 
varianza a una via: 

F - CMTR 
CME 

_ 047 
5.1 

= 0.09 
F = CMBL 

CME 

191.26 

5.1 

= 37.50 


Vale la pena notar que se calculan dos valores F - uno que utiliza CMTR y uno que utiliza CMBL. El valor F para 
CMBL se calcula para determinar si los bloques se realizaron de manera efectiva. Si el bloqueo se basa en un factor 
que no afecta la productividad del operador, los resultados pueden ser enganosos. Por tanto, la empresa de 
contabilidad debe hacer pruebas para ver si existe una diferencia significativa entre las medias del bloque (fila). Si 
no existe diferencia significativa entre los niveles promedio de production con base en los bloques (filas), 
entonces la experiencia no es un factor crftico. En este caso, se deberfa abandonar el analisis de varianza a dos 
vias, y se necesitarfa regresar al analisis de varianza a una sola via, sin distinci6n entre los niveles de experiencia. 
A un nivel del 5%, el valor crftico de F para CMBL con 4 y 8 grados de libertad se obtiene de la tabla G y es F 0 05 4 8 
= 3.84. Los grados de libertad 4 y 8 se utilizan porque la relaci6n F para los bloques utiliza CMBL con r - 1 = 4 
grados de libertad y CME con (r-l)(c-l) = 8 grados de libertad. 

La firma contable debe primero probar la hip6tesis de que el nivel promedio de producci6n para cada nivel de 
experiencia es el mismo. Si es asf, entonces la experiencia no es un factor determinante en la produccidn, y el 
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bloqueo sobre esta serfa inutil. Si los niveles promedio de produccion y los niveles de experiencia no son los mismos, 
entonces la empresa de contabilidad debe bloquear la experiencia para coiregir su impacto y por ende obtener una 
medida mas exacta de las diferencias en la calidad del sistema de computation. La hipotesis a probar es 

f~L\ = /x 2 ~ /x 3 = /x 4 = 

H a \ No todas las medias de las filas son iguales 
en donde ju. son los niveles promedio de produccion para cada nivel de experiencia (fila). 

Regia de decision: “No rechazar la hipotesis nula si F <3 .84. Rechazar la hipotesis nula si F> 3.84”. 

Debido a que F = 37.50, la hipotesis nula deberia rechazarse, y la empresa deberia concluir que los niveles de 
experiencia tienen un efecto en las tasas de produccion. Debe corregir la experiencia utilizando el analisis de 
varianza a dos vias. 

Ahora la empresa esta preparada para probar la hipotesis en la cual estuvo originalmente interesada. ^Existe 
alguna diferencia en la produccion promedio de los sistemas de computacion (tratamientos)? Si el valor a del 5% 
se mantiene, F ^ = F Q0528 = 4.46 se obtiene de la tabla. Los grados de libertad de 2 y 8 se utilizan porque 

la razon Fpara los tratamientos utiliza CMTR con 2 grados de libertad y CME con 8 grados de libertad. El conjunto 
de hipotesis es 

H 0 : /x 3 = fi 2 = fi 3 

H A : No todas las medias de las columnas son iguales 
En donde fX. son las medias de las columnas para los tres sistemas de computacidn. 


Regia de decision: “No rechazar la hipotesis nula si F <4.46. Rechazar la hipotesis nula si F > 4.46”. 

La tabla 10.4 indica que F = 0.09 < 4.46. La hipotesis nula no se rechaza, y la empresa concluye que los niveles de 
produccion promedio de los tres sistemas de computacion no difieren, una vez que se ha hecho la correction para 
el factor experiencia. Los empleados de diferentes niveles de experiencia se desempenan igualmente bien en todas 
las maquinas. No interesa cu&l sistema de computacion compren. 

El ejemplo 10.3 proporciona otra ilustracidn del ANOVA o analisis de varianza a dos vias 


Ejemplo 10.3 

Una emisidn reciente de la revista Fortune describid los esfuerzos realizados por una importante 
empresa de electrdnica para desarrollar un sistema en el cual se les daba a los empleados la 
oportunidad de evaluar el desempeno de sus supervisors y de algun personal administrativo. Se 
seleccionan aleatoriamente cinco empleados y se les pide evaluar a cuatro de sus gerentes sobre 
una escala de 10 a 50. Los resultados, junto con las medias de las filas y las columnas, aparecen en 
la siguiente tabla. 


Empleado 


Gerente (tratamiento) 


* 

1 

2 

3 

4 

1 

31 

35 

46 

38 

37.50 

2 

29 

32 

45 

36 

35.50 

3 

13 

17 

35 

20 

21.25 

4 

28 

38 

52 

39 

39.25 

5 

14 

20 

40 

20 

23.50 


30.6 


7 = 31.4 


23 


28.4 


43.6 
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El gerente de la empresa de electronica desea saber si existe diferencia en las clasificaciones 
promedio de los cuatro gerentes. 

Solucion 

El director decide utilizar el analisis de varianza a dos vi'as para probar las medias: 

SCT= 2S(X, y -Xf 

= (31 - 31.4) 2 + (29 - 31.4) 2 + • • • + (39 - 31.4) 2 
+ (20 - 31.4) 2 
= 2344.8 

SCTR = ZrjiXj -Xf 

= 5(23 - 31.4) 2 + 5(28.4 - 31.4) 2 + 5(43.6 - 31.4) 2 
+ 5(30.6 - 31.4) 2 
= 1145.2 

SCBL = 2c, <Xi ~Xf 

= 4(37.5 - 31.4) 2 + 4(35.5 - 31.4) 2 
+ 4(21.25 - 31.4) 2 + 4(39 - 31.4) 2 
+ 4(23.5 - 31.4) 2 
= 1124.3 

SCE = SCT- SCTR -SCBL 

= 2344.8 - 1145.2 - 1124.3 
= 75.3 

La tabla ANOVA a dos vfas se convierte en: 


Fuente de variation 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Entre muestras (tratamiento) 

1,145.2 

3 

381.73 

60.79 

Entre bloques 

1,124.3 

4 

281.08 

44.76 

Dentro de muestras (error) 

75.3 

12 

6.28 


Variation total 

2,344.8 

19 




Ahora el director puede determinar si hay una diferencia significativa en las clasificaciones promedio 
dadas por cada uno de los cinco empleados (filas), las cuales requeriran hacer bloques sobre los 
empleados. Las hipotesis son: 

H 0 : Mi = M 2 = Ms = M 4 = Ms 

H a : No todas las medias de las filas son iguales 

Si a = 1%, el valor F apropiado es F 001 4 12 = 5.41 . El valor F relacionado con la prueba sobre los 
bloques aparece en la tabla de analisis de varianza como 44.76> 5.41 . La hipotesis nula se rechaza, 
y el director determina, a un nivel de significancia del 1%, que las clasificaciones promedio hechas 
por los cinco empleados (filas) son diferentes y se necesita el bloqueo. 

El director puede probar ahora su hipotesis inicial respecto a las clasificaciones promedio de los 
cuatro gerentes (columnas). Las hipotesis son 
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H o : Mi = M 2 = Ms = M 4 

H a \ No todas las medias de las columnas son iguales 

El valor F de F 001 3 12 = 5.95 es menor que 60.79. La hipotesis nula debe rechazarse a un nivel de 
significancia del 1%. 

Interpretation 

A1 incluir un factor de bloqueo, el director pudo detectar una diferencia significativa en la clasificacidn 
promedio de los gerentes realizada por parte de los cinco empleados. Sin el factor de bloqueo, la 
variacion en las clasificaciones, debido a los bloques (diferencias en las actitudes de los empleados), 
se hubiera incluido en el factor de error SCE. Esto hubiera tenido el efecto de incrementar la SCE y 
el CME . 

El valor F, por tanto, hubiese sido menor debido a que F = CMTRJCME. A medida que el valor F 
disminuye, existe una mayor probabilidad de no rechazar la hipdtesis nula. 

Sin embargo, con el analisis de varianza a dos vias, el CME se subdivide en la variacion debida 
a los bloques ( CMBL ) y en la variacion debida al error dentro de las muestras (CME). 


Ahora que el director sabe que no todas las clasificaciones de los gerentes son las mismas, puede utilizar el 
metodo de Tukey o el metodo DMS para determinar cuales son diferentes. Al aplicar estas herramientas a una 
prueba a dos vias, deben hacerse ciertos cambios en los grados de libertad relacionados con el metodo Tukey. En 
lugar de explorar ese ajuste, el metodo DMS puede utilizarse con el an&lisis de varianza a dos vias como se 
demostro anteriormente. 


La pantalla 1 0.2 muestra la impresion en Minitab del ejemplo 10,3, La porcidn superior proporciona la tabla de 
analisis de varianza. Sin embargo, como lo expresa el manual de Minitab, no se puede especificar si los efectos son 
aleatorios o fijos con el comando TWOWAY. Por tanto, Minitab no proporciona los valores F o los valores p. 
Minitab aparentemente espera que usted los calcule manualmente. La hipotesis para las medias de las filas 
(bloqueo sobre los empleados) 

H 0 : /xj = fi 2 = fi z = = fx 5 


lleva un valor F de 


CMBL 

CME 


281.08 

6.28 


— 44.76 > F o.o5 t 4,u ~ 3.26 


La hipotesis nula de medias iguales de la fila se rechaza al nivel del 5%, y se utiliza el andlisis de varianza a dos vias 
para probar la hipotesis primaria de iguales clasificaciones promedio para los gerentes: 

** M i = M2 = M3 = M 4 


El valor Fes 


CMTR 

CME 


381.73 

6.28 


60.79 > F 0 05 3 12 — 3.49 


La hipotesis nula de clasificaciones promedio para los gerentes se rechaza al nivel del 5%. Las comparaciones por 
pares se muestran en las porciones restantes de la impresion. 

Los resultados de la prueba para las medias de la fila (empleado) se hallan en la seccidn del medio de la 
impresion. Vale la pena notar que no todas las medias son iguales. Las medias de los empleados 3 y 5 son menores 
que las otras tres. Los resultados para la hipotesis primaria respecto a las clasificaciones de los gerentes se 
encuentran en la ultima portion de la impresidn. El gerente 3 tiene la clasificacion mas alta y el gerente 1 tiene la 
clasificacion mas baja. Al nivel de significancia del 5% no parece haber ninguna diferencia en las clasificaciones 
promedio de los gerentes 2 y 4. 
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Pantalla 10.2 


Two-Way Analysis of 

Varience (Analisis 

de varianza 

a dos vias) 



Analysis of Variance 

i for 

rating 





Source (Fuente( 

DF 

SS 

MS 

DF = 

Grados de liber tad 

Employee (Empleado) 

4 

1124.30 

281.08 

SS = 

Sumas de 

cuadrado s 

Manager (Gerente) 

3 

1145.20 

381.73 

MS = 

Cuadrado 

medio 

Error 

12 

75.30 

6.28 




Total 

19 

2344.80 






Individual 95% Cl (I.C. del 95% individual) 


Employee (Empleado) Mean (Media) 


Manager (Gerente) 
1 
2 

3 

4 


MTB > 


37. 

35. 

21 . 

39. 

23. 


* ) 


24.0 


30.0 


36.0 


42.0 


Individual 95% Cl (I.C. del 95% individual) 


Mean (Media) 
23.0 
28.4 

43.6 

30.6 


( — *_.) 


21.0 


(___*__) 
(- 

28.0 


i 

i 

* 

i i 

(-- 

35.0 

+ 

42.0 


49.0 


Ejercicios de la seccion 


7. Como recien graduado con un titulo en mercadeo, usted acaba de ser aceptado en un gran trabajo con una 
importante empresa de cosmeticos de New York. Debe ayudar en el analisis de la efectividad de tres 
presentaciones publicitarias. Se seleccionan aleatoariamente cinco clientes. A cada uno se le presenta un 
anuncio y se le pide calificarlo. A continuacion se muestran los resultados. Su supervisor no esta seguro de 
como proceder, pero sus amplios conocimientos en analisis estadfstico, con base en su trabajo en el curso de 
la universidad, le dice que el analisis de varianza a dos vias es apropiado ya que cada cliente (bloque) califico 
los tres anuncios (tratamientos). ^Existe alguna diferencia significativa en las actitudes de los consumidores? 
Sea a =0.01. 


Consumidor 

Presentation publicitaria 

1 

2 

3 

1 

50 

45 

45 

2 

45 

30 

35 

3 

30 

25 

20 

4 

45 

35 

40 

5 

40 

30 

35 


8. Debits and Credits Inc., una firma de contabilidad en Rocky Top, Tennessee, tiene la politica de evaluar a cada 
nuevo empleado haciendo que complete varias afirmaciones contables y que compile todo error. Usted y 
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otros dos miembros nuevos de las empresas, Seymore Nueshaum y Gretchen Nordick, deben llenar las seis 
declaraciones. Esto lo revisa un socio antiguo de la empresa y los errores que cada uno de ustedes cometio 
aparecen en la siguiente tabla. Parece que uno de ustedes puede ser mas o menos eficiente en sus destrezas 
contables. Sea a= 0.05. Si es asi, ^cual es? Se decide hacer bloques en cada afirmacion para dar cuenta de toda 
diferencia en la dificultad que pueda existir. 




Numero de errores 

Afirmacion 

Usted 

Seymore 

Gretchen 

1 

2 

2 

3 

2 

1 

3 

4 

3 

0 

1 

4 

4 

4 

6 

5 

5 

2 

3 

4 

6 

1 

4 

3 

Las negociaciones actuales entre el sindicato y la gerencia se concentran en el efecto que tienen los metodos 
de remuneration en la produccion del trabajador. Una gran empresa tiene cinco plantas. En cada una, a los 
trabajadores se les paga por comision, salario, o un plan de bonifications . Tres trabajadores, seleccionados 
aleatoriamente de todas las plantas, recibieron cada uno un metodo diferente de pago. Su produccion diaria 
medida en unidades aparece aqui. Se piensa que es necesario bloquear las plantas corrigiendo toda diferencia 
que pueda existir en la produccion promedio de la planta. 

Con base en estos datos, ^cual plan de pagos sugerirfa a la gerencia si 
Sea a =0.05. 

el objetivo es maximizar la produccion? 



Metodo de pago 


Planta 

Comision 

Salario 

Bonificaciones 

1 

25 

25 

37 

2 

35 

25 

50 

3 

20 

22 

30 

4 

30 

20 

40 

5 

25 

25 

35 


10 . Una empresa carbomfera en West Virginia planea analizar la produccion promedio de tres minas, Cuatro 
grupos de trabajo trabajaran en cada mina y registraran en toneladas la produccion de carbon resultante. 
Debido a que cada grupo trabajara en cada mina, se utilizara el analisis de varianza a dos vfas haciendo 
bloqueo en los grupos. Como nuevo supervisor administrative, usted debe determinar si existe alguna 
diferencia en la productividad de las minas. Sea a = 0.01. Senale cuales minas son mas productivas con un 
subrayado comun. 


Grupo 

Mina 1 

Mina 2 

Mina 3 

1 

42.7 

54.1 

56.9 

2 

47.1 

59.2 

59.2 

3 

32.1 

53.1 

58.7 

4 

29.2 

41.1 

49.2 


11 . Speedo fabrica bicicletas de turismo para verdaderos ciclistas. El ingeniero jefe de control de calidad decide 
I comparar las velocidades mas altas obtenidas, utilizando tres mecanismos de cambios diferentes; 5 ciclistas 
experimentados son cronometrados cuando coixen con cada uno de los tres mecanismos, los resultados 
aparecen aqui. ^Los datos sugieren una diferencia en las velocidades promedio a un nivel del 1%? 
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Ciclista 


Mecanismo 


1 

2 

3 

1 

40 

51 

37 

2 

42 

49 

38 

3 

37 

53 

38 

4 

45 

57 

41 

5 

42 

42 

40 


The U-Plant’um Nursery debe determinar si existe alguna diferencia en la tasa de crecimiento de los arboles 
jdvenes que se han tratado con fdrmulas de quimicos diferentes. Debido a que la condicion del suelo se debe 
considerar, los Arboles jdvenes tratados con cada fdrmula se plantan en cada uno de tres tipos de suelo. Las 
tasas de crecimiento resultantes durante un penodo determinado aparecen a continuacion. ^Parece existir una 
diferencia en el factor de crecimiento de las fdrmulas despues de hacerse la correccion sobre el suelo? Sea a 1%. 



Formula 


Tipo de suelo 

1 

2 

3 4 

Arenoso 

10 

8 

5 7 

Arcilloso 

12 

15 

17 14 

Rocoso 

17 

16 

15 15 

Curly, Moe, y Larry venden tenedores electricos puerta a puerta. Cada uno va independientemente a cuatro 
barrios y entregan sus propios registros de ventas. El numero de tenedores electricos vendidos se encuentra 
registrado en la tabla. A un nivel del 5%, ^parece que uno de los vendedores tiene un futuro m&s brillante que 
los otros? Si es asi, ^cual es? Debido a que cada vendedor visito todos los vecindarios, haga una prueba para 

ver si deberia utilizarse el bloqueo. 




Vecindario 

Curly 

Moe 

Larry 

1 

15 

12 

19 

2 

27 

25 

12 

3 

24 

29 

30 

4 

32 

31 

29 


14. El Institute) Nacional de Salud practico encuestas a 1,060 adultos para determinar como pasaban su tiempo 
libre. Los datos han sido desglosados por grupos de edad y se han condensado a solo 16 observaciones para 
efectos de computation. ^Parece haber alguna diferencia en el tiempo promedio que se pasa en las diferentes 
actividades? Las observaciones estan en horas por semana. Haga una prueba para determinar si deberia 
utilizarse el bloqueo. Sea a = 0.05 


Encuestados (por edad) 



Actividad 


TV 

Lectura 

Deportes 

Tiempo con la familia 

15-18 

35 

12 

10 

6 

19-25 

22 

13 

12 

8 

26-35 

25 

15 

8 

15 

36 y mas anos 

27 

20 

5 

20 


10.5 Analisis factorial 

En la discusion sobre el analisis de varianza a dos vias, se reconocid la presencia de un segundo factor que 
influenciana las unidades experimentales. Ya que no se tuvo interes en analizar esta segunda fuerza, se busco 
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eliminar este impacto. En un ejemplo anterior sobre la productividad del sistema, se temia que la experiencia 
contaminara los resultados del estudio y por ello se bloqueo el nivel de experiencia. 

Se asume ahora que se desea no solamente probar el sistema de computacion, sino tambien comparar el efecto 
de los dos paquetes de software distintos en la produccion. Por tanto, se desea probar simultaneamente el efecto 
de dos factores diferentes en la produccion: el sistema de computacion y el paquete de software. El diseno 
experimental apropiado que se empleara se denomina analisis factorial, o analisis de varianza de dos factores. 


Analisis factorial Evaluacion de dos factores de interes al mismo tiempo. 


En analisis factorial se puede efectuar una prueba de efectos principales por cada factor. Cada prueba es muy 
parecida como las presentadas anteriormente: se diseiian para determinar si niveles diferentes de cualquier factor 
tienen impacto en las unidades experimentales en diversas formas. Si no se encuentran efectos principales para un 
factor, la hipotesis nula no se rechaza. 


Prueba de efectos principales Pruebas sobre ambos factores para determinar si los 
niveles diferentes del factor influyen en las unidades de manera diversa. 


Vale la pena notar que en analisis factorial existen dos aspectos a considerar. Cada factor tiene mas de un nivel. Se 
puede decir que el factor A tiene a niveles y el factor B tiene b niveles. En este caso en particular se desea comparar 
tres sistemas de computadores y dos paquetes de software. Por consiguiente, el factor A tiene tres niveles y el 
factor B tiene dos niveles. Hay aXb y o seis combinaciones del sistema/paquete. Esto es lo que se denomina como 
diseno factorial 3X2. Cada combinacion se llama tratamiento . Ahora hay seis tratamientos diferentes en 
consideracion. Cada tratamiento, o combinacion de sistema/paquete, se muestra en una de las seis celdas que 
apareceran en la tabla. 

En los estudios anteriores sobre analisis de varianza, cada celda contenfa solo una observacion. Por ejemplo, 
solo una persona con una cantidad de experiencia dada registro su produccion en la celda apropiada. Sin embargo, 
para realizar el analisis factorial, debe aparecer mas de una observacion en cada celda. El numero de observaciones 
dentro de una celda es lo que con ffecuencia se denomina numero de replicaciones, r. La tabla 10.5 lo ilustra. En 
cada una de las seis celdas aparecera la produccion de varias unidades experimentales (empleados). El primer 
empleado que trabaja en el sistema 1 y el paquete 1 (Sl/Pl) puede producir 27 unidades de produccion. Si otros 
dos empleados se seleccionan para trabajar en Sl/Pl, pueden producir 26 y 25 unidades respectivamente. El 
promedio de esa celda, fi u , es igual a 26. La prueba debe disenarse de manera que cada celda tenga el mismo 
numero de observaciones. Un numero desigual va mas alia del alcance de este texto. Toda la tabla aparece como 
la tabla 10.5, con tres observaciones en cada una de las seis celdas, resultan 18 unidades experimentales. 


Tabla 10.5 

Configu racion 
de las celdas 
para el analisis 
factorial 


FACTOR A (sistema de computacion) 
Tres niveles del factor A 


1 2 3 


FACTOR B (paquete ^ 

de software) 

27 

26 

25 

A, = 26 

20 

22 

21 

A2-21 

30 

26 

28 

Aa = 28 


28 

20 

30 

Dos niveles 2 

27 

26 

31 

del factor B 

29 

23 

29 


CO 

CM 

II 

=c 

Aa = 23 

As = 3 0 
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Se dice que el diseno es completamente aleatorizado si las 18 unidades se asignan aleatoriamente a una 
celda. Por otra parte, se asume que solo tres empleados se seleccionan aleatoriamente y cada uno se desempenara 
en todas las seis combinaciones de sistema/software. En este caso, las celdas serfan homogeneas y se hanan 
bloques no solo en las columnas sino tambien en las filas. Esto es lo que se denomina un diseno de bloques en 
analisis factorial. Los autores se concentraran en la configuration aleatoria. 

El analisis factorial tiene la ventaja de ser menos costoso. Se pueden estudiar dos factores con un experimento 
en lugar de realizar dos pruebas independientes. Por tanto, no solo se puede ahorrar tiempo y esfuerzo, sino que 
se puede lograr el mismo grado de exactitud utilizando menos unidades experimentales, ya que ambas pruebas se 
realizan al mismo tiempo. 

O quiza de mayor valor aun es el hecho de que al utilizar el diseno factorial se puede identificar toda interaccion 
que pueda existir entre los dos factores. Esta interaccion seria imposible detectarla si los experimentos se realizaran 
por separado o si cada celda tu viera solo una observation. 

En analisis factorial cada factor tiene varios niveles. El sistema de computacion, factor A, tiene tres niveles y 
los paquetes de software, factor B tienen dos niveles. Se dice que la interaccion existe si un nivel del factor A 
funciona de manera diferente (bien sea mejor o peor) con niveles diferentes del factor B. Por ejemplo, el sistema de 
computacion 1 puede ser mas (o menos) productivo con el paquete de software 1, mientras que el sistema de 
computacion 3 puede funcionar mejor con el paquete de software 2. Por tanto, el impacto total del factor A 
(sistema) sobre la productividad, depende de cual nivel del factor B (software) se utilice. Se dice que los dos 
factores interactuan en su impacto sobre la productividad. 


Interaccion La relacion entre el factor A y la variable en analisis (productividad en 
este caso) depende del nivel del factor B que se utilice. 


La interaccion puede detectarse analizando las diferencias promedio entre los niveles de un factor relativo a 
los niveles diferentes del otro factor. Si estas diferencias promedio son las mismas en todos los niveles de ambos 
factores, no existe interaccion. Por otra parte, la interaccion existe si las diferencias promedio entre los niveles de 
un factor no son las mismas para todos los niveles del otro factor. 


Interaccion La interaccion ocurre cuando las diferencias en las respuestas promedio 
para los dos niveles de un factor no son las mismas en todos los niveles del segundo 
factor. 


Esto puede mostrarse utilizando un sistema de graficos. Se comienza con un diseno factorial que no presenta 
interaccion. Se consideran nuevamente los datos de la tabla 10.5. Las medias de todas las celdas se muestran en 
la figura 10.2. Vale la pena destacar que las rectas no se intersectan. El nivel 2 del factor: paquete es mayor que el 


Figura 10.2 

Analisis factorial 
sin interaccion 
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nivel 1 para todos los tres niveles del factor: sistema. De hecho, el nivel 2 del paquete agrega dos unidades al nivel 
1 para todos los tres niveles del sistema de factores. Una grafica con segmentos de recta paralela como estas, 
prueba la ausencia de interaccion. Se dice que los efectos son aditivos. 

Se asume que las pruebas arrojaron los resultados que aparecen en la tabla 10.6. El grafico de las medias de las 
celdas aparece en la figura 10.3. Vale la pena destacar que las rectas si se cruzan. No hay una adicion constante 
entre los niveles del factor paquete a lo largo de todos los niveles del factor sistema. Mientras que el nivel 2 del 
factor paquete adiciona 2 unidades al primer nivel del factor sistema (28 > 26), este patron no continua. De hecho, 
el nivel 1 del factor paquete vario de bajo a alto dependiendo de con cual nivel del sistema se formo la pareja. Por 
ejemplo, se podrfa decir que la production se beneficio de la interaccion derivada de la conformation del par del 
nivel 3 del factor sistema y el nivel 2 del factor paquete. 


Tabla 10.6 

Analisis factorial 
con interaccion 


FACTOR A (sistema de computacion) 
Tres niveles del factor A 




1 

2 

3 

FACTOR B 
(paquete 
de software) 

1 

28 

26 

24 

M„ = 26 

25 

23 

27 

Mi 2 - 25 

30 

29 

28 

Mn = 28 

Dos niveles del 
factor B 

2 

28 

27 

29 

Mn = 28 

29 

31 

27 

Mn = 29 

28 

27 

26 

Mn - 27 


Figura 10.3 

Analisis factorial 
que evidencia 
interaccion 



(paquete) 

(paquete) 


Como se dijo anteriormente, la ausencia de interaccion se comprueba con las rectas paralelas. Sin embargo, las 
rectas no necesitan ser perfectamente paralelas como para concluir que la interaccion no esta presente. Para 
ilustrar esta idea, cuando se prueba la hipotesis de que p = 100, no se necesita una media muestral de exactamente 
100 para no rechazar la hipotesis nula. Los valores cercanos a 100 son suficientes para el no rechazo. De la misma 
forma, las graficas con las rectas que son aproximadamente paralelas, proporcionan apoyo a la hipotesis nula. 

Un metodo mas preciso para detectar la interaccion reside en la prueba de hipotesis. Se pueden identificar tres 
hipotesis que se deben probar. 

H q : Las medias de la columna son iguales (Prueba de efectos principales del factor sistema) 

H Q : Las medias de la fila son iguales (Prueba de efectos principales para el factor paquete) 

H q : No hay interaccion presente 

Las hipotesis altemativas para cada prueba se plantean al contrario, como es el caso usual. 
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De la misma manera que con el analisis de varianza a una via y a dos vias, ahora se esta preparado para 
desglosar de las sumas de cuadrados y construir la tabla factorial para probar la hipotesis. Los calculos necesarios 
son muy tediosos cuando se realizan manualmente; entonces, para realizar esta tarea, se confiara exclusivamente 
en el analisis por computador. 

Dados los datos de la tabla 10.5, Minitab se utiliza para generar la tabla factorial de la pantalla 10.3. La prueba 
para la interaccion es F = 0.00/2.83 = 0 < F 0 12 = 3 .89. No se rechaza la hipotesis de no interaccion. El impacto del 
sistema de computacion sobre la productividad no depende de cual programa de software se utilice. La prueba 
para estimar la diferencia en software es F- 1 8.00/2.83 = 6.36 > F Q 05 { 12 = 4.75 . Se rechaza la hipdtesis nula de que 
las medias de la fila son iguales. Finalmente, la prueba para hallar una diferencia en las medias del sistema es F = 
78.00/2.83 = 27.56 > F Q05 2 12 = 3.89 y se rechaza la hipotesis nula. 


Pantalla 10.3 

Two-way Analysis of Variance (Analisis de 

varianza 

a dos vias) 

Analysis of Variance for 

Product 

(Analisis 

de varianza para producto) 

Source (Fuente) 

DF 

SS 

MS 

DF = Grados de libertad 

Software 

1 

o 

o 

00 

18.00 

SS = Sumas de cuadrados 

System (Sistema) 

2 

156.00 

78.00 

MS = Cuadrado medio 

Interaction (Interaccion) 

2 

0.00 

o 

o 

o 


Error 

12 

34.00 

2.83 


Total 

17 

208.00 



MTB > 






Por otra parte, se asume que la prueba de los sistemas de computacion y los paquetes de software produjeron 
los datos que aparecen en la tabla 10.6. La impresidn resultante en Minitab, pantalla 10.4, muestra que la interaccion 
si esta presente. El valor F de 14.0/2.50 = 5.60 > F Q 05 2 n = 3.89. 


Pantalla 10.4 


Two-way Analysis of Variance (Analisis de varianza a dos vias) 


Analysis of 

Variance 

for Product 

(Andlisis de varianza para producto) 

Source 

DF 

SS 

MS 

Software 

1 

8.00 

8.00 

System 

2 

4.00 

2.00 

Interaction 

2 

28.00 

i- 1 

o 

o 

Error 

12 

30.00 

2.50 

Total 

17 

. 70.00 


MTB > 





10.6 Diseno en cuadrado latino 

Otro tipo de diseno de bloques permite hacer bloques en dos variables extranas al mismo tiempo. Vale la pena 
recordar el ejemplo de los sistemas de computacion en el cual se deseaba bloquear el nivel de experiencia para 
retirar la influencia exterior. Se asume ahora que tambi6n se desea corregir la hora del dia en la cual se realiza el 
trabajo, debido a que se conoce que la productividad de los empleados varfa durante el dia. Algunos empleados 
son mas efectivos durante la manana, otros durante la tarde, y otros son “gente noctuma”. Ahora se tienen dos 
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variables sobre las cuales se desea hacer bloques. Se quiere eliminar la influencia de dos elementos exteriores para 
capturar una verdadera y precisa impresion de la capacidad del sistema real. El esquema experimental apropiado 

es el diseno en cuadrado latino. 

Una de las variables del bloque se asigna a las filas y la segunda a las columnas. Los tratamientos se organizan 
para que ocurran una vez en cada fila y en cada columna. Por consiguiente, el numero de filas, el mimero de 
columnas y el numero de tratamientos deben ser todos el mismo. 


Diseno en cuadrado latino Se utiliza cuando se desea bloquear el efecto exterior de 
dos variables que pueden producir resultados equlvocos. 


El diseno en cuadrado latino permite al investigador obtener mas informacion con una muestra mas pequena, ya 
que elimina la variacidn exterior haciendo el bloqueo en dos variables. A diferencia del analisis factorial, el diseno 
en cuadrado latino contiene solo un elemento por tratamiento y por celda. 

Como se acaba de expresar, si hay r tratamientos en consideracidn, se debe tener r niveles para cada una de las 
variables de bloqueo. Por consiguiente, se tiene r X r = r 2 elementos, lo que sugiere el t6rmino cuadrado. El 
diseno se denomina cuadrado latino porque las letras latinas como A, B y C se utilizan para denotar los tratamientos. 

Debido a que hay tres sistemas de computacion que se desea probar, ahora se seleccionaran tres empleados 
para que trabajen en cada sistema durante cada uno de los tres perfodos. Se tienen tres tratamientos (sistemas de 
computacion) y tres niveles para cada bloque: es decir, tres niveles de experiencia y tres periodos de tiempo. Se 
dice que se tiene cuadrado latino 3X3. Los tres sistemas de computacion (tratamientos) se identiflcaran como A, 
B, y C. Cada tratamiento aparecera en todas las filas y columnas del cuadrado. 

Ahora se debe dividir las sumas de los cuadrados entre las filas, las columnas y los tratamientos. Esto se logra 
utilizando el siguiente conjunto de formulas. La suma de cuadrados del bloque de filas ( SCBF) se halla: 


Suma de cuadrados 
del bloque de filas 


SCBF - 


2( suma de fila) 2 
r 



[ 10 . 17 ] 


en donde (suma de fila) es la suma de cada fila 

r es el numero de tratamientos 

X es cada una de las observaciones 

i 

La suma de los cuadrados del bloque de columnas ( SCBC) es: 


Suma de cuadrados del o 2( suma de columna) 2 (SAT,) 2 

bloque de columnas SCBC ~ r " r 2 


[ 10 . 18 ] 


en donde (suma de columna) es la suma de cada columna 
La suma de cuadrados del tratamiento (SCTR) es 


Suma de cuadrados 
del tratamiento 


SCTR = 


2 (sum a TRT , ) 2 



[ 10 . 19 ] 


r 
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en donde (suma TRT) es la suma de cada uno de los tratamientos A, B y C. 
La suma de cuadrados total es: 


Suma de cuadrados 
total 


SCT = X(X,) 2 



[ 10 . 20 ] 


donde (X ) 2 es el cuadrado de los nueve valores de produccion. Por ultimo, para la suma del cuadrado del error se 
tiene que: 


Suma del cuadrado 
del error 


SCE = SCT - SCTR -SCBC - SCBF 


[ 10 . 21 ] 


Se asume que el experimento produjo los datos que aparecen en la tabla 10.7. La primera celda de B/15 significa 
que el primer empleado que trabaja en la manana produce 15 unidades de produccion en la maquina B. La celda 
superior derecha de C/ll significa que el primer empleado que trabaja en la noche produjo 11 unidades de 
produccion en la maquina C. 


Tabla 10.7 

Datos para un 
diseno latino 




Hora 



Empleado 

Manana 

Tarde 

Noche 

Total filas 

1 

B/15 

A/18 

C/11 

44 

2 

C/12 

B/20 

A/9 

41 

3 

A/17 

C/19 

B/10 

46 

Total 

columnas 

44 

SA= 44 

£B = 45 

£C = 42 

57 

30 

131 


Aplicando las formulas ( 1 0. 1 7) a ( 1 0.2 1 ) se tiene que: 


SCBF = 


SCBC = 


SCTR = 


(44 ) 2 + (41) 2 + (46) 2 

( 1 3 1 ) 2 

3 

3 2 

4.222 

(44 ) 2 + (57 ) 2 + (30) 2 

( 1 3 1 ) 2 

3 

3 2 

121.5556 

(44)2 + ( 45)2 + ( 42)2 

( 1 3 1 ) 2 

3 

3 2 


= 1.5556 


SCT = (15) 2 + (12 ) 2 + (17) 2 + • • • + (10 ) 2 


( 1 3 1 ) 2 
3 2 


= 138.222 
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Por tanto, SCE = 10.89. La tabla aparecerfa como la tabla 10.8. 


Tabla 10.8 

Diseno en cuadrado 
latino para la prueba 
de computador 


Fuente de variation 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Bloques de fila 

4,222 

2 

2.111 

0.3877 

Bloques de columna 

121,555 

2 

60.778 

11.1621 

Tratamientos 

1,555 

2 

0.7775 

0.1428 

Error 

10,890 

2 

5.445 


Total 

138,222 




H : fi } = fi 2 = ju 3 Las producciones promedio de todos los tres computadores son iguales 
F- 0.1428 < f 000S22 = 19; No reehazar la hipotesis nula 


Fijando aal 5%, el valor F para F 0 0522 = 19 >0.1428, y por tanto no serechaza la hipotesis nulade quenohay 
diferencia en la produccion promedio de los computadores despues de ajustar la experiencia del empleado y la 
hora del dfa. 


Ejercicios de la seccion 


15 . Un productor de alambre metalico desea comparar la resistencia a la tension utilizando tres mezclas diferentes 
de qirimicos: A, B y C. Es necesario controlar el tipo de homo utilizado para “fundi r” la mezcla, y la temperatura 
a la cual se fundio. Utilizando los siguientes datos, ^que conclusion saca usted para el fabricante? Sea a 1%. 


Horno 


Temperatura 


Bajo 

Medio 

Alto 

1 

A/40 

B/42 

C/18 

2 

B/70 

C/19 

A/45 

3 

C/20 

A/51 

B/27 


16 . Como director de mercadeo, usted esta interesado en comparar los ingresos de tres marcas — “bueno”, 
mejor”, “optimo” — respecto a los tenedores electricos que vende su empresa. Para lograrlo, usted desea 
corregir el area del pais en la cual se encuentra ubicada la tienda, y el tipo de tienda en la cual se hizo la venta. 
Su asistente recolecta datos para las ventas mensuales en cientos de dolares que aparecen a continuacion, 
pero no tiene idea sobre que hacer con ellos. Haga la prueba usted mismo e informe al asistente sobre sus 
hallazgos. Sea a 1%. 


Tienda 


Area 


Noreste 

Sureste 

Centro 

Descuentos 

Buena/4.2 

Mej or/9.0 

La mejor/ 12.9 

Materiales 

Mejor/7.3 

La mejor/11.1 

Buena/11.3 

Centro comercial 

La mejor/8.0 

Buena/9.4 

Mejor/10.7 


17 . Un investigador recolecta datos sobre los sueldos en la facultad para determinar si existe diferencia o no en 
los ingresos promedio de los que estan en las areas de administration, ciencias sociales y ciencias natural es. 
Debe eliminar los efectos extranos del rango y tamano de la escuela. Utilizando la information que se observa 
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aqui respecto a los salarios en miles de dolares, ^cuales supone usted que sean los resultados? Sea a 1% e 
interprete. 


Rango 


Tamano 


Pequeno 

Mediano 

Grande 

Profesor auxiliar 

Bus/65 

SS/60 

NS/78 

Profesor asociado 

SS/72 

NS/81 

Bus/79 

Profesor titular 

NS/82 

Bus/73 

SS/79 


Problemas resueltos 

1. Fleecing the Motorist, Estudio sobre los consumidores , publico los resultados de una encuesta sobre los 
habitos de conduction en los Estados Unidos. Los datos conteman impuestos a la gasolina por hogar para 
los 50 estados. Seis estados se escogieron aleatoriamente de cuatro regiones del pais para determinar si hay 
alguna diferencia en el impuesto promedio anual de la gasolina dentro de las regiones. Los siguientes 
resultados se aproximaron al dolar mas proximo: 




Region (tratamiento) 


Estado 

Norte(l) 

Sur(2) 

Occidente(3) 

Centro de EEUU(4) 

1 

US$293 

US$121 

US$114 

US$136 

2 

280 

116 

176 

164 

3 

283 

223 

224 

117 

4 

242 

238 

183 

153 

5 

268 

118 

159 

152 

6 

184 

222 

149 

108 

X 

j 

258.3 

173.0 

167.5 

138.3 

X= 184.3 






Un economista deseaba probar al nivel del 5% la hipotesis de que en promedio los residentes de las cuatro 
regiones pagan la misma suma en los impuestos federales sobre la gasolina. 

Solution 

SCT = - f ) 2 

= (293 - 184.3) 2 + ■ • • + (108 - 184.3) 2 
= 83,515 


SCTR se halla: 


SCTR = IrfXj -X ) 2 

= 6(258.3 - 184.3) 2 +•••+ 6(138.3 - 184.3) 2 
= 48,023 


SCE = ZZ(X,j ~ X/ 

= (293 - 258.3) 2 + ■ • • + (108 - 138.3) 2 
= 35,492 


SCE es: 
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Entonces, 


CMTR = 

c - 1 

= 48 > 023 
4 - 1 

= 16,008 


CUE = 


SCE 
n — c 


35,492 

24-4 


= 1,775 


Si a se fija en 5%, F Q0 = 3.10 como se observa aqui. La hipotesis es H 0 : JL1 1 = (li 2 = |a 3 = |J, 4 . 



La tabla del analisis de varianza es 


Fuente de variacion 

SC 

g.l. 

CM 

Valor F 

Entre muestras (tratamiento) 

48,023 

3 

16,008 

9.02 

Dentro de muestras (error) 

35,492 

20 

1,775 


Variacion total 

83,515 

23 




W . : Ml 

H a : No todas las medias son iguales 

Regia de decision: No rechazar la hipotesis nula si F < 3.10. Rechazar si F> 3.10 
Conclusion: rechazar la hipotesis nula 


Puede concluirse a un nivel de significancia del 5% que el impuesto promedio no es el mismo en las cuatro 
regiones. 

2. quienes se les cobra mas duro? Para formular un sistema tributario efectivo, el gobiemo debe determinar 
cuales regiones pagan mas y cuales pagan menos. Utilizando tanto el metodo de Tukey como el metodo DMS , 
los calculos se realizarian como se muestra aqui. 

Solucion 

Primero es necesario hallar las diferencias absolutas entre las medias muestrales de los impuestos pagados en 
cada par de las cuatro regiones. 
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El criterio de Tukey es: 


|X> - 

-* 2 I = 

| 258.3 

- 173.0| 

= 85.3 

1 *. - 

-*jl = 

1 258.3 

- 167.5| 

= 90.8 

1*1 • 

-* 4 I = 

1 258.3 

- 138.3 1 

- 120.0 

1 *2- 

-*sl = 

1 173.0 

- 167.5| 

= 5.5 

1 *2- 

-* 4 I = 

1 173.0 

- 138.3 | 

= 34.7 

1*3- 

-* 4 I = 

1 167.5 

- 138.3| 

= 29.2 




ICME 



T = 

Qa.t.n-c 

V r 



Si a se fija en 5%, q 005 420 = 3.96, 


T = 



= 68.11 


Toda diferencia absoluta entre las medias muestrales mayor que 68.11 es significativa y sugiere que sus 
respectivas medias poblacionales son diferentes. Existe solo un 5% de probabilidad de que dos de estas 
poblaciones puedan tener la misma media y generar muestras de estos tamanos con medias superiores a 
68.11. A1 comparar 68.11 con los seis pares de las medias muestrales anteriores, puede observarse que la 
poblacion 1 (norte) tiene una media diferente de las otras tres; se asume que p, es mas alto debido a que X x es 
significativamente mas alto que el resto. 


Utilizando el metodo DMS se tiene que: 


h{CME)F Q , ~Z 
DMS = yj 1 — £As = £ 

F 005 1 20 = 4-35 Entonces, 

= 50.73 

El criterio DMS se compara con las diferencias absolutas entre las medias muestrales anteriores. Toda diferencia 
mayor que 50.73 es significante. De nuevo se observa que los motoristas del norte tienen la carga tributaria 
mas pesada. 

3. Acme Ltd. Como supervisor de produccion de Acme Ltd., Melvin Moore desea comparar los niveles de 
produccion de las cuatro plantas de Acme. Los datos semanales sobre los niveles en toneladas se recolectan 
durante un perfodo determinado de siete semanas, incluyendo las cuatro semanas del mes de agosto y las 
primeras tres semanas de septiembre. Los resultados se muestran en la tabla . 


Semana 


Planta (tratamiento) 


X. 

1 

2 

3 

4 

1 

42.7 

38.3 

42.9 

30.1 

38.5 

2 

47.3 

35.1 

38.2 

37.5 

39.5 

3 

57.3 

42.7 

49.9 

47.8 

49.4 

4 

63.1 

58.2 

59.3 

53.9 

58.6 

5 

49.2 

32.7 

45.7 

33.8 

40.4 

6 

51.2 

30.1 

48.3 

38.7 

42.1 

7 

48.0 

31.1 

45.2 

39.7 

41.0 

z 

X= 44.23 

51.3 

38.3 

47.1 

40.2 
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Melvin realiza un analisis de varianza a una via y encuentra una diferencia significativa en los niveles de 
produccion promedio. Sin embargo, antes de presentar este reporte a la alta gerencia, Melvin se da cuenta de 
algo importante: las siete semanas no se seleccionaron aleatoriamente para cada planta. Los datos para las 
mismas siete semanas se utilizaron para todas las cuatro plantas. Quiza deberfa hacer bloques en las semanas 
para eliminar toda variacion debida al perfodo. Ya que las mismas semanas se registraron para cada planta, es 
posible el bloqueo en semanas. 


Solucion 

SCT y SCTR se calculan de la misma forma que con el problema resuelto 1 y se halla que son 2,276. 1 y 76 1 .4, 
respectivamente. Ademas: 

SCBL = 2c, (X, - I) 2 

= 4(38.5 - 44.23) 2 + 4(39.5 - 44.23) 2 
+ • • • + 4(41 - 44.23) 2 


= 1,276.6 


SCE = SCT - SCTR - SCBL 


CMTR 


238.1 
SCTR 
c — 1 


= 761.4 
“4-1 
= 253.8 
SCBL 

CMBL = 7 

r ~ 1 

__ 1,276.6 

”7-1 

= 212.8 


CME 


SCE 

(r “ Die ~ 1) 


= 238.1 

” (7 - 1)(4 - 1) 
= 13.2 


Estos calculos se resumen en la tabla de analisis de varianza a dos vias: 


Fuente de variacion 

SC 

g-i- 

CM 

Valor F 

Entre muestras (tratamiento) 

761.4 

3 

253.8 

19.23 

Entre bloques 

1,276.6 

6 

212.8 

16.12 

Dentro de muestras (error) 

238.1 

18 

13.2 


Variacion total 

2,276.1 

27 




Primero, Melvin debe determinar si el bloqueo sobre las semanas es efectivo. El fija a al 5%. El valor Fpara 
los bloques es CMBL/ CME, y debido a que CMBL tiene r - 1 = 6 g.l. y CME tiene (r-c)(c- 1) = 1 8 g.l., F 0 05 6 18 
= 2.66 se halla que es el valor cntico de F. Ya que F = 16.12 > 2.66, Melvin concluye que la produccion 
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promedio entre semanas es diferente. Por consiguiente, el bloqueo es necesario para corregir la variation de 
una semana a la otra. Melvin deberfa continuar con esta prueba a dos vias. 

El puede probar ahora la hipotesis primaria sobre los niveles de produccion promedio de la planta 

H 0 : (X\ = A4 = M 3 = M 4 

H a : No todas las medias son iguales 

El valor F para tratamientos tiene c - 1 = 3 y (r - 1 )(c - 1 ) = 1 8 g.l. F 0 05 3 18 = 3 . 16 < 1 9.23 . Se rechaza la hipotesis, 
y Melvin concluye que hay alguna diferencia en los niveles de produccion promedio. Ahora puede utilizar el 
DMS para determinar cuales son diferentes. 

4. Conduccion en Circle Circle Trucking Company desea determinar si el tiempo promedio de conduccion es el 
mismo para cada una de las tres rutas. El director de transito para Circle considera que es necesario corregir 
las condiciones climaticas asi como la pericia de los conductores. Se identifican tres niveles de condiciones 
climaticas: deficiente, regular y buena. Se seleccionan tres conductores con capacidades cambiantes y cada 
uno cubre tres rutas bajo cada una de las tres condiciones climaticas. Los resultados se reportan en el diseno 
en cuadrado latino que se muestra en el texto. Vale la pena recordar que las letras latinas indican las variables 
en consideration, en este caso, las rutas. Se registran los tiempos en minutos. 




Clima 



Conductor 

Deficiente 

Regular 

Bueno 

Total filas 

1 

A/20 

C/18 

B/17 

55 

2 

C/22 

B/10 

A/10 

42 

3 

B/18 

A/9 

C/8 

35 

Total columnas 

60 

ZA = 39 

37 

ZB = 45 

35 

ZC = 48 

132 


Solution 

Utilizando el diseno en cuadrado latino hay dos variables extranas para corregir (destrezas y clima), los 
calculos aparecen como: 


SCF - 


see = 


SCTR = 


(55) 2 + (42) 2 + (35) 2 

(132) 2 

3 

9 

68.667 

(60) 2 + (37) 2 + (35) 2 

(132) 2 

3 

9 

128.667 

(39) 2 + (45) 2 + (48 ) 2 

(132) 2 

3 

9 


= 14 


SCT 


(20) 2 + (22) 2 + • • • + 


( 8) 2 — 


(132) 2 

9 


= 230 

= 230 - 14 - 128.667 - 68.667 
= 18.663 


SCE 
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Fuente 
de variacion 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Bloques de filas (conductor) 

686,667 

2 

34.33 

3.679 

Bloques de columna (clima) 

128,667 

2 

64.33 

6.895 

Tratamiento (ruta) 

14,000 

2 

7.00 

0.750 

Error 

18,663 

2 

9.33 


Total 

230,000 





Si la hipotesis va a probarse al nivel del 5%, F 00S22 = 19 > 0.750. Por tanto. Circle no deberia rechazar la 
hipotesis nula. 


Lxsta cte fovmutas 


[10.1] 

XII 

II 

Gran media de todas las 
observaciones del experimento 

[10.2] 

, 2(X, - X) 2 

n ~~ 1 

La varianza muestral 

[10.3] 

SCT = X^iX.j-X) 2 

La suma de cuadrados total es la 
variacion de los valores alrededor 
deX 

[10.4] 

SCTR = ZrjiXj -X) 2 

La suma de los cuadrados del 
tratamiento mide la variacion en las 
medias de la columna alrededor de 
la gran media 

[10.5] 

SCE = - X) 2 

La suma de los cuadrados del error 
refleja la variacion de los valores 
dentro de un tratamiento alrededor 
de su propia media 

[10.6] 

CMT = SCT 
n - 1 

Cuadrado medio total 

[10.7] 

CMTR = SCTR 
c — 1 

Cuadrado medio del tratamiento 

[10.8] 

CME = SCE 
n — c 

Cuadrado medio del error 

[10-9] 

B ^ 

ii 

Razdn F para la prueba de las 
medias 

[10.10] 

X » IcME 

tfa,c,n~c Y ^ 

El criterio de Tukey que mide el 
valor crftico de la diferencia entre 
medias 

[10.11] 


El criterio DMS mide la diferencia 
crftica entre dos medias - para 
diseiios balanceados 
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[ 10 . 12 ] 

[ 10 . 13 ] 

[ 10 . 14 ] 

[ 10 . 15 ] 

[ 10 . 16 ] 

[ 10 . 17 ] 

[ 10 . 18 ] 

[ 10 . 19 ] 

[ 10 . 20 ] 


DMSjj. = 



(CME)F aXn _ c 


SCBL = 2 Ci (X, - X ) 2 


SCE = SCT- SCTR - SCBL 


CME = 

(r - l)(c - 1) 

CMBL = 

r - 1 

2(suma fila) 2 (IX) 2 

:F = — 

/* 


SCC 


X(suma columna) 2 (EX f ) 2 
- _ 


SC7K 


S(suma 7X7^ (IX) 2 


SCT = I(X 2 ) 


&X) 2 


El criterio DMS mide la diferencia 
critica entre dos medias - para 
disenos no balanceados. 

La suma de los cuadrados del 
bloque mide las desviaciones de las 
medias de la fila alrededor de la gran 
media 

La suma de cuadrados del error mide 
la variacion aleatoria de las 
observaciones alrededor de sus 
medias de tratamiento 

Cuadrado medio del error en 
analisis de varianza a dos vias 

Cuadrado medio de bloque 

Suma de cuadrados del bloque de filas 
para el diseno en cuadrado latino 

Suma de cuadrados del bloque de 
columnas para el diseno en 
cuadrado latino 

Suma de cuadrados del tratamiento 
para el diseno en cuadrado latino 

Suma total de cuadrados para el 
diseno en cuadrado latino 


[ 10 . 21 ] 


SCE = SCT - SCTR - SCBC - SCBF 


Suma de cuadrados del error para 
el diseno en cuadrado latino 


Ejercicios del capftulo 

18. Como analista de mercadeo usted desea determinar si hay una diferencia en las ventas promedio en tres 
mercados: Pittsburgh, Toledo y Columbus. ^Por que no eliminar la necesidad del analisis de varianza tan solo 
probando para hallar la igualdad entre cada par de mercados? ^Si no se rechaza cada hipotesis, usted puede 
concluir entonces que todos los tres mercados tienen la misma media? 

19. ^Por que un valor F alto resulta en un rechazo de la hipotesis nula de medias iguales? 

20. ^Cual es la diferencia entre un modelo de efectos fijos y un modelo de efectos aleatorios? 

21. ^Cual es la diferencia entre un analisis de varianza a una via y un analisis de varianza a dos vias? 

22. ^Bajo que condiciones utilizarfa usted el analisis factorial? ^Un diseno en cuadrado latino? 

23. ^Cual es la diferencia entre un diseno balanceado y un diseno no balanceado? 
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24. De acuerdo con un articulo en la revista Fortune , las empresas manufactureras mas pequenas tienen cada vez 
mas dificultad para recibir los pedidos de sus proveedores dentro de un tiempo razonable. A medida que la 
economia se calienta y la capacidad de produccion se restringe, los pedidos tienden a retrasarse. Como 
supervisor de produccion de Novelties, Inc., usted desea probar el tiempo de entrega promedio en dias, para 
los pedidos que usted hace con tres proveedores diferentes del componente del cojm de lujo whoopie que 
fabrica su empresa. Aqui se presentan los tiempos de entrega. A un nivel del 5%, ^existe una diferencia en los 
tiempos promedio? 

Proveedor 1 : 5, 6, 6, 5, 6, 6, 7 
Proveedor2: 5, 4, 5, 5, 6, 5,4 
Proveedor 3: 4, 5, 2, 6, 5, 2, 4 

25. Dados los resultados del problema anterior, ^cual(es) proveedor(es) recomendana? ^Cual(es) recomendana 
evitar? Sea a = 0.01. Resuma los resultados con el subrayado comun. 

26. Una discusion en American Agriculture llamo la atencion sobre el efecto de diferentes suplementos alimenticios 
en grano en las tasas de crecimiento de los polios criados comercialmente. En Charlie’s Chicken Ranch, se 
practico una prueba en la cual 18 polios se dividieron de forma homogenea en tres grupos, y cada grupo era 
alimentado con un suplemento en particular. Los incrementos en crecimiento durante un perfodo de seis 
semanas, medidos en libras, aparecen en la siguiente tabla. A un nivel del 10%, ^parece haber evidencia que 
indique cual suplemento deberfa utilizar Charlie en el futuro? 


Polio 


Suplemento 


Grow-big 

Cluckers Choice 

Cock of the Walk 

1 

2.2 

3.7 

3.8 

2 

2.4 

2.1 

4.1 

3 

2.7 

3.2 

3.9 

4 

3.8 

2.9 

2.7 

5 

3.2 

3.9 

4.1 

6 

3.9 

3.8 

3.2 


27. Hay muchos aspectos por considerar en el desarrollo de una estrategia de mercadeo. La ubicacion de la 
tienda es una preocupacion importante. PDQ, una cadena de materiales en todo el sudeste, informo los 
resultados en una publication interna sobre una encuesta de ingresos semanales provenientes de tiendas 
con ubicaciones urbanas, suburbanas y rurales. Los datos, los cuales se han simplificado para nuestros 
propositos, se muestran a continuation. ^Puede llegarse a alguna conclusion respecto a las ubicaciones 
principals para las tiendas? Determine cual(es) ubicacion(es), si la(s) hay, es (son) mejor(es). Sea a = 0.05. 
Muestre los resultados con subrayado comun. 


Tienda 


Ubicacion 


Urbana 

Suburbana 

Rural 

1 

789 

612 

718 

2 

762 

655 

655 

3 

722 

725 

725 

4 

745 

609 

645 

5 

802 

632 

622 
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28 . Una emision reciente de Bicycling discutia el uso de programas de computation en el desarrollo de un 
regimen de entrenamiento. Uno de esos programas de computation probaba a varios ciclistas que estaban en 
condition fisica superior y concluyeron que para que los entrenamientos extendidos fueran mas beneficos 
deberfan hacerse al 60 o 70% de la proportion maxima de latidos del corazon del individuo (aproximadamente 
220 latidos por minuto menos la edad de la persona). Entrenamientos mas intensos de una duration mas corta 
deberfan llegar a 80 o 90% de ese maximo. 

Los tres programas de entrenamiento fueron disenados para determinar las tecnicas optimas de entrenamiento. 
Se asume que los individuos aplicaron cada programa, y despues de seis semanas, se monitored la tasa de 
latidos finales. Los datos se encuentran registrados en la siguiente tabla y representan los porcentajes de las 
tasas maximas recomendadas. A un nivel del 5%, parece haber diferencia en las tasas maximas promedio de 
los latidos del corazon? 


Cidista 

Programa de entrenamiento 

1 

2 

3 

1 

0.62 

0.68 

0.72 

2 

0.73 

0.52 

0.69 

3 

0.59 

0.59 

0.73 

4 

0.82 

0.63 

0.74 

5 

0.79 

0.61 

0.68 


29. Complete los calculos del problema anterior, fijando a = 0. 10. Haga graficas para las distribuciones F en cada 
caso, mostrando una comparacion de las pruebas para cada valor a. 

30 . Business Week manifesto que John F. Akers, director ejecutivo de la IBM, dijo que consideraba improbable 
que en el futuro cercano, el crecimiento anual en ventas de la IBM del 6.1% pudiera seguir el ritmo del 
crecimiento general del sector, cifrado en el 9.2% de toda la industria. Este rezago en los recibos se debia en 
parte a la confianza de la IBM en los macrocomputadores, cuyo mercado en las ventas mundiales habia 
bajado al tercer lugar, tras los PCs y los minicomputadores. 

Los datos trimestrales sobre el porcentaje del incremento en las ventas para cinco perfodos se han recolectado 
para cada uno de estos mercados de hardware. Los resultados son 

Macrocomputadores: 3.2, 4.8, 4. 1 , 4.2, 3.9 
PCs: 8.7, 9.2, 9.3, 8.3, 8.9 
Minicomputadores: 9.1, 9.4, 8.7, 9.5, 9.9 

^Estos datos muestran alguna diferencia significativa en los incrementos promedio en ventas a un nivel del 1%? 

31 . USA Today imprimio una historia sobre el uso de detectives privados para efeetos de descubrir algunos hechos 
que pudieran hacer que la empresa fuera menos deseable desde el punto de vista de una fusion por adquisicion. 
“M & A work” dice J.B. Kroll, presidente de Kroll y Associados, una empresa de detectives con sede en Nueva 
York “da cuenta de por lo menos el 20% de los US$50 millones que Kroll deberfa percibir este aho”: Petroquimicos, 
banca, computadores y electronica son industrias especialmente fertiles para M & A . 

Se asume que seis empresas de cada industria se investigan aleatoriamente mediante encuestas para determinar 
los montos involucrados en las propuestas de adquisicidn, y los resultados aparecen a continuation. ^Podrfa 
concluirse, al nivel del 5% que existe alguna diferencia en las propuestas promedio entre estas industrias? 
Los valores estan en millones de dolares. 
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Licitacion 

Petroquimicos 

Banca 

Computadores 

Electronica 

1 

919.3 

842.7 

647.3 

743.7 

2 

874.2 

1,144.7 

873.2 

747.3 

3 

832.7 

942.3 

714.4 

812.5 

4 

732.9 

747.1 

652.8 

643.7 

5 

893.2 

812.7 

855.6 

682.1 

6 

1,321.4 

855.6 

642.1 

632.1 


32. El gran lobo malo desea engordar a los tres cerditos para la cena de la festividad. Sus datos muestran que la 
cantidad de alimento en libras que cada cerdito ha comido, para una muestra de cinco dias, es la siguiente: 

Cerdito 1 

Cerdito 2 

Cerdito 3 

12 

14 

19 

15 

16 

18 

14 

15 

17 

16 

18 

16 

13 

12 

18 


a . ^Al nivel del 5%, existe alguna diferencia en la cantidad promedio ingerida por los cerditos? 

h. Utilice el criterio de Tukey para determinar cual cerdito o cerditos deben engordarse primero. Resuma con 
el subrayado comun. 

c. Realice las mismas pruebas por pares utilizando el metodo DMS. Resuma con el subrayado comun. 

33. Cuando el presidente Clinton retiro el embargo comercial a Vietnam en el ano de 1994, muchas companfas de 
Estados Unidos iniciaron relaciones comerciales. Los datos que aparecen en el cuadro son los montos 
comerciales (en miles de millones de dolares) para cuatro industrias. Sea a 1%. ^Cual es su conclusion 
respecto a la diferencia en los niveles comerciales promedio de estas cuatro industrias? Utilice el metodo de 
Tukey para sacar conclusiones sobre las comparaciones por pares. Resuma con el subrayado comun. 


Petroleo 

Bebidas 

suaves 

Maquinaria 
de construccion 

Computadores 

2.1 

5.6 

1.5 

4.5 

2.5 

6.2 

1.0 

4.2 

2.6 

7.8 

1.8 

4.1 

2.1 

6.8 

1.9 

4.6 

3.5 

5.4 

1.7 

4.2 


34. Un economista del Departamento de Estado de Estados Unidos, especialista en demografia, obtuvo los 
siguientes datos que demuestran una inmigracion anual en millones de personas de cuatro paises diferentes 
en una muestra de cinco anos. Si a es 1%, ^que conclusion puede sacar respecto a la comparacion de las 
medias? 
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Inglaterra 

Mexico 

Canada 

Francia 

1.5 

2.5 

0.9 

0.8 

1.6 

2.6 

1.1 

0.6 

1.8 

2.7 

0.8 

0.8 

1.7 

2.9 

1.1 

0.7 

1.6 

2.5 

0.9 

0.9 


35. 

36. 


Equipo administrative 


Metodo 


1 

2 

3 

1 

40 

37 

43 

2 

31 

31 

32 

3 

27 

49 

43 

4 

52 

28 

44 

5 

63 

37 

32 

6 

57 

27 

37 


Utilice tanto el metodo de Tukey como el DMS para hacer comparaciones por pares sobre los resultados del 
problema anterior. Complete con un subrayado comun. 

Una empresa de consultorfa prueba tres metodos diferentes para la toma de decisiones, comparando la 
cantidad de tiempo que requieren los equipos administrativos que utilizan cada uno de estos metodos para 
terminar los proyectos financieros. Con base en los datos que aparecen a continuation, ^parece que el 
metodo de toma de decisiones afecta el tiempo necesario para terminar el proyecto? Sea a 10%. Los tiempos 
se miden en dias transcurridos hasta la termination del proyecto. 


37. Como director de publicidad de su firma, usted desea comparar la efectividad de varios formatos publicitarios. 
Se muestran tres anuncios a varios compradores, quienes los califican en una escala del 10 al 50. Los 
resultados aparecen aqui. ^Cu&les anuncios seleccionarfa, si los hay, sobre los otros, para distribuirlos en 
masa? Sea a = 0.10%. Resuma los resultados con el subrayado comun. 


Comprador 

Anuncio publicitarios 

1 

2 

3 

1 

45 

40 

30 

2 

40 

30 

35 

3 

35 

30 

30 

4 

35 

35 

30 

5 

40 

40 

35 

6 

35 

25 

30 

7 

30 

25 

30 


38. Se practicd una encuesta informal sobre los habitos de citas de los estudiantes en una universidad del 
estado. Aqui se muestran los resultados que registran el numero de citas por mes. A un nivel del 5%, ^parece 
haber alguna diferencia por clase en la frecuencia de las citas? Si es asi, utilice tanto el metodo de Tukey como 
el DMS para determinar cu&les son diferentes. Resuma los resultados con subrayado comun. 
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Estudiante 


Clase 


Fr 

So 

Ju 

Sr 

1 

2 

2 

3 

4 

2 

2 

0 

5 

2 

3 

1 

2 

6 

5 

4 

2 

6 

4 

3 

5 

0 

4 

3 

3 

6 

3 

4 

6 

4 


39. Cuando la ola de ofertas de adquisiciones hostiles alcanzo un frenesf exagerado a finales de los anos 80, 
muchas empresas reportaron el uso de “pfldoras venenosas” para hacerse menos atractivos ante otras 
empresas que estuvieran planeando adquisiciones. Las “pfldoras” eran acciones que se realizaban para 
desilusionarse de una adquisicion, e inclufa planes de deudas para pensionados, politicas de opcion de 
compra de acciones y paracaidas dorados para ejecutivos pensionados, lo cual era desfavorable para la 
empresa que adquirfa. Un estudio disenado para medir los efectos comparables de estas tres acciones, 
registraron cambios en los precios de las acciones de varias empresas que lo utilizaron. Los datos se muestran 
a continuation. A un nivel del 5%, ^parece que algunas pfldoras son mas efectivas para reducir el precio de 
las acciones de las empresas? 


Empresa 

Planes de prestamos 
para pensionados 

Opcion de compra 
de acciones 

Paracaidas 

dorados 

1 

-1.55 

-2.10 

0.20 

2 

-2.54 

-3.20 

-1.10 

3 

-3.55 

-1.47 

1.55 

4 

-2.10 

1.01 

-1.25 

5 

1.50 

-3.55 

2.10 

6 

-2.17 

-2.99 

1.20 


40. Utilizando los datos del problema anterior, ^cu&les pfldoras recomendarfa usted a su junta directiva si desearan 
reducir los precios de las acciones para hacer su empresa menos atractiva? Sea a = 0.05. Muestre el subrayado 
comun apropiado. 

41. \3tva empresa national que eomercra\vza uua \ 0 ti 6 n brouceador a sdectiona aiealonameute a cinco personas 
para que prueben las tres fdrmulas. Cada locidn se aplica a diferentes partes del cuerpo en todos los sujetos 
de prueba. Despues del tiempo designado en el sol, el factor de bronceado se mide utilizando una escala 
desairollada por un dermatdlogo reconocido. 


Sujetos de prueba 


Formulas de bronceado 


Tan Your Hide 

Burn Not 

Tanfastic 

1 

3 

4 

5 

2 

5 

4 

4 

3 

4 

3 

4 

4 

4 

5 

3 

5 

3 

2 

4 
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Sea a = O.Ol y determine si alguna formula promociona un bronceado mas que las otras. Si es asi, identifique 
cuales son. Dadas las diferencias en los sujetos de prueba en la capacidad bronceadora natural, haga la 
prueba para determinar si se necesita el bloqueo. 

42. Una empresa de taxis intenta crear un sistema de rutas que minimizara el tiempo que se pasa manejando a 
ciertas localidades. Hay cuatro rutas en consideration. Usted es contratado como consultor estadistico para 
que ayude. Cinco taxistas utilizan cada una de las rutas y registran sus tiempos en minutos. A un nivel del 5%, 
^puede identificar cual(es) ruta(s) es(son) mas rapida(s)? ^Debena bloquear sobre el conductor? ^Cual(es) 
ruta(s) aconsejarfa a la compama que utilizara? 


Taxista 


Ruta 


1 

2 

3 

4 

1 

12 

15 

17 

13 

2 

18 

18 

18 

17 

3 

10 

11 

15 

9 

4 

13 

12 

12 

15 

5 

18 

14 

12 

15 


43. Cuatro inspectores de control de calidad acaban de terminar un curso de entrenamiento. Cada uno inspecciona 
las mismas cinco unidades de producto terminado y se le pide calificarlas. A un nivel del 5%, parece que los 
inspectores asignan las mismas calificaciones promedio? 


Producto 


Inspector 



Fred 

Sam 

Terri 

Minerva 

1 

55 

45 

52 

51 

2 

87 

86 

78 

82 

3 

69 

68 

67 

62 

4 

75 

71 

72 

68 

5 

69 

71 

75 

68 


44. Un grupo de consumidores locales esta interesado en determinar si las tiendas en diferentes localidades de 
toda la ciudad offecen los mismos precios para los alimentos. A una canasta de muestra con cinco articulos 
se le fijo precio en los tres sitios de la ciudad. A un nivel del 1%, ^parece que los precios en promedio son los 
mismos para los tres lugares? 


Producto 


Lugar 


Centro 

Suburbio 

Afueras 

1 

2.92 

3.15 

4.35 

2 

1.21 

1.32 

1.10 

3 

5.12 

4.79 

5.20 

4 

0.98 

1.00 

0.98 

5 

1.50 

1.45 

1.50 


45. El propietario de Stop & Shop ha probado cuatro polfticas diferentes de cambios de cheques para reducir el 
gran numero de cheques sin fondos que recibe su tienda. El desea saber cual politica, si la hay, minimiza el 
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problema. Debido a que el area del centro en la cual se encuentra ubicada la tienda puede afectar el numero de 
cheques sin fondos, se mantienen los registros diarios sobre el numero de cheques devueltos por fondos 
insuficientes bajo cada politica en todas las cinco tiendas. Los resultados se muestran a continuacion. Sea a 
1 %. ^Es una politica mejor que otra? 


Lugar 


Politica 


A 

B 

C 

D 

1 

22 

35 

47 

43 

2 

27 

28 

31 

47 

3 

20 

17 

15 

12 

4 

18 

20 

23 

17 

5 

15 

18 

18 

19 


46 . D. Bumstead trabaja como agente de publicidad para Dithers & Company. El Sr. Bumstead debe determinar si 
tres anuncios publicitarios diferentes evocan la misma respuesta de los televidentes. El senor Bumstead, 
sabiendo que la hora del dia puede influir en las actitudes, decide sabiamente probar cada anuncio en los 
mismos tres penodos durante perfodos de 24 horas. ^Los resultados que aparecen a continuacion dicen al 
senor Bumstead si existe una diferencia en las calificaciones promedio de los televidentes? Se asume un valor 
a del 1%. 


Peri'odo 


Anuncio 


A 

B 

C 

Manana 

10 

15 

12 

Tarde 

2 

2 

3 

Noche 

2 

1 

2 


47 . Bantam Books utiliza tres tecnicas de impresion diferentes. Un estudio en control de calidad encontro excesivos 
errores de impresion como tachones, sobreimpresion, caracteres borrosos y algunas paginas incluso quedaron 
en bianco. Para determinar si hay alguna diferencia en el numero promedio de errores con base en el metodo 
de impresion, se imprimio un cierto pasaje utilizando cada metodo en los cuatro tipos de papel que utiliza 
Bantam. ^Los resultados indican que uno o mas metodos son mejores? Sea a 5%. 


Tipo de papel 

Metodo de impresion 

A 

B 

C 

W 

2 

1 

1 

X 

3 

3 

2 

Y 

5 

6 

3 

Z 

4 

4 

4 


Ejercicio por computador 

Dada su considerable experiencia en la industria de inversion, usted decide establecer su empresa de corretaje. Su 
primera tarea es comparar los rendimientos promedio de tres industrias diferentes. Ingrese al archivo ANOVA de 
su disco de datos. La primera columna de datos (“Rate”) es la tasa de crecimiento para varias compamas en las tres 
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industrias que usted desea examinar. La segunda columna (“Ind”) identifica cada industria y esta codificada como 
1 para industria electronica, 2 para industria de seguros, y 3 para industria bancaria. 

Usted tambien desea comparar los rendimientos promedio de diferentes inversionistas con base en el tamano 
de su inversion. La tercera columna del conjunto de datos es la tasa de rendimiento TR o rate of return “ROR” que 
los inversionistas ganaron durante el ano anterior. La cuarta columna identifica el tamano de la inversion como 
pequena, mediana y grande codificado como 1, 2, y 3 respectivamente. Usted tambien considera necesario 
corregir el nivel de actividad en la cuenta, en la comparacion de los rendimientos promedio de inversiones de 
diferente tamano. Por tanto, la quinta columna esta codificada de 1 a 5 para diferenciar entre las cuentas comerciales 
con menos actividad y las que presentan un nivel mayor de actividad. Entre mas alto sea el codigo de valor, la 
cuenta se comercializa mas activamente. 

Prepare todo el analisis necesario y presente sus descubrimientos en forma de reporte estadfstico, como se 
presenta en el apendice I. 


JO! PUESTA 


John S. Mill recibio recientemente un tftulo de maestrfa en 
economia orientado hacia la investigacion y durante los 
ultimos 18 meses ha estado trabajando con la CIA (Agenda 
Central de Inteligencia) como analista economico. 
Acompano a la delegacion de Estados Unidos a Denver 
para las charlas de los G-7 que se mencionaron en la section 
“Escenario” a comienzos de este capftulo. Su proyecto 
actual es identiflcar caracteristicas que puedan servir como 
predictores de disturbios dentro de un pais extranjero. Una 


EN ESCENA 


desempleo y tasas de inflacidn para varios pafses en cuatro 
areas de todo el mundo. Estos valores aparecen aquf 
primero con la tasa de desempleo y despues con la tasa de 
inflation. Asf, unaentrada como “17.5% & 20.2%” significa 
que el pais tiene una tasa de desempleo de 17.5 % y una 
tasa de inflacidn de 20.2%. 

La agenda ha presupuestado US$4,700,000 para la 
adquisicion de equipo adicional de recoleccidn de 


Pa is 

Medio Oriente 

Este de Europa 

Lejano Oriente 

Centroamerica 

1 

17.5% & 20.2% 

10 . 2 % & 8 . 2 % 

18.1% & 9.70/0 

27.8% & 50.2% 

2 

16.1% & 10 . 2 % 

8.4% & 7.30/0 

30.2% & 17.50/0 

39.7% & 40.3% 

3 

12.5% & 8.7% 

7.2 % & 6.3% 

25.30/0 & 21.20/0 

37.8% & 47.3% 

4 

15.2% & 17.1% 

7.5% & 5.30/o 

19.7% & 10.2% 

42.1% & 80.7% 

5 

22.3% & 18.7% 

9.20/o & 6 . 10/0 

21.3% & - 

37.0% & 38.9% 

6 

18.3% & 23.7% 

10.7% & - 

22 . 0 % & - 

48.0% & 73.1% 

7 

19.20/0 & - 

17.1% & - 

24.10* & _ 

38.70* & 63.2% 


vez que se hayan aislado tales factores, los pafses que 
presentan esas tendencias seran objeto de estudio y analisis 
adicional. 

El antecedente economico de John le ha ensefiado que 
las naciones con alto fndice de desempleo y otras 
condiciones economicas desfavorables, con frecuencia tienen 
m£s probabilidad de sufrir desordenes. La divisidn de 
analisis de datos de la CIA proporciona a John cifras sobre 


information de inteligencia durante los proximos anos. 
John debe preparar un informe indicando c6mo deberian 
asignarse estos fondos. ^Como puede utilizar John estos 
datos en el proceso de toma de decisiones respecto a la 
asignacion apropiada del dinero? Los superiores de John 
lo han pievenido de que a toda costa, debe evitar rechazar 
la hipotesis de diferencias no significantes en estos pafses, 
incluso si no existe ninguna. 
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Del escenario a la vida real 

Si, la CIA tiene un sitio publico en Internet ( www.odci.gov/cia ). Cuando usted visite este sitio, necesitara hacer 
clic en un area de “continue” para llegar a la pagina de caracterfsticas. AIK, seleccione “Publications”, y luego 
seleccione “World Fact Book”. En esta area, usted encontrara informacion similar a la utilizada en el analisis de la 
seccion “Puesta en escena”. El sitio proporciona datos sobre desempleo, inflation, y PIB por pais para la mayorfa 
de los paises del globo. A1 hacer clic en “all countries” o en regiones en particular, busque los datos mas actuales 
sobre estos tres indicadores economicos para cada uno de los 10 paises de la tabla que aparecen en la seccion 
inicial del capltulo “Escenario”. Se proporcionan los datos disponibles en este sitio dos anos atras al tiempo 
actual y solo se suministran los datos de un ano. 

De manera altema, se encuentran disponibles los datos intemacionales sobre los indicadores economicos 
claves que estan actualizados y proporcionan los datos de los tres ultimos anos sobre el Departamento de Estado 
de Estados Unidos (www.state.gov). Esta informacion economica resumida, forma parte de los informes completos 
de investigacion comercial sobre los paises individualmente. Para su escogencia de tres de los 10 paises enumerados 
en el inicio del capltulo “Escenario” busque los datos economicos resumidos proporcionados en este sitio. En la 
pagina de presentation (Home Page) de U.S. State Department (Departamento de Estado de Estados Unidos) 
seleccione “Services”. Baje hasta el encabezado Business, y despues haga clic en “Countiy Commercial Guides” 
(Gulas comerciales del pals). Luego seleccione una nueva region geografica y despues seleccione un pals de 
interes. En el perfil comercial del pals, baje a seccion X: Apendices para buscar informacion resumida sobre la 
economla nacional. A medida que usted se mueve por este informe, vale la pena destacar otras secciones importantes 
de estos perfiles. 

Si usted estuviera haciendo investigacion intemacional comparativa, ^cuales sitios, la CIA o el Departamento 
de Estado de Estados Unidos, serfa su primera selection y por que? 





Plan del capitulo 


Este capitulo estudia dos de las mas importantes y utiles herramientas del analisis estadistico: la regresion y la 
correlaci6n. Estas t^cnicas poderosas ilustran la forma como pueden analizarse las relaciones entre dos variables 
para predecir eventos futuros. 


Regresion y correlation 
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E S C E N A R I 0 


La competencia en la industria de las bebidas suaves siempre 
ha sido intensa. Recientemente, la lucha entre Coca-Cola y 
Pepsi-Cola se ha puesto algida por incrementar sus 
participaciones respectivas de US$27 mil millones en el 
mercado nacional de bebidas. Cada compama ha ofrecido 
su propia marca de flair promocional en un esfuerzo 
continue por reorganizar la mezcla en su mercadeo y 
promocionar su respectivo producto. Coca-Cola 
actualmente goza de un 21.7% de participacidn en el 
mercado, seguido de Pepsi al 18.9%. 

Sin duda alguna los ejecutivos de mercadeo, los 
especialistas en gerencia y los estadfsticos trabajan duro en 
ambas compamas intentando sobrepasar a sus contrapartes 
de mente competitive Hasta ahora se ban puesto de acuerdo 


en muy poco, salvo en que las ventas parecen incrementar 
con las elevadas temperaturas del verano. 

Predecir las tendencias en la participacidn de mercado 
es una tarea especialmente ardua y dificil. Muchos 
ejecutivos han echado a perder sus carreras en el frustrado 
intento de anticipar correctamente el comportamiento de 
los volubles consumidores. 

La regresion y el analisis de correlacidn son las dos 
herramientas mas poderosas y utiles que los analistas de 
todo tipo tienen a su disposition para escudrifiar el interior 
del futuro sombrio. En este capitulo se analizaran estos 
procedimientos y se ensenara c6mo ellos pueden orientar 
a los profesionales en negocios en su busqueda de una 
carrera exitosa. 


Ventas de bebidas suaves y temperatura 
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11.1 Introduction 

La regresi6n y la correlation son las dos herramientas estadisticas mas poderosas y versatiles que se pueden 
utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que se 
puede identificar y cuantificar alguna relation funcional entre dos o mas variables. Se dice que una variable 
depende de la otra. Se puede decir que Y depende de X en donde Y y X son dos variables cualquiera. Esto se puede 
escribir asi 


Yes una funcion de X 


Y=f(X) 


[in] 


Se lee “7 es funcion de X ' . 
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Debido a que 7 depende de X , Y es la variable dependiente y X es la variable independiente. Es importante 
identificar cual es la variable dependiente y cual es la variable independiente en el modelo de regresion. Esto 
depende de la logica y de lo que el estadistico intente medir. El decano de la universidad desea analizar la relacion 
entre las notas de los estudiantes y el tiempo que pasan estudiando. Se recolectaron datos sobre ambas variables. 
Es logico presumir que las notas dependen de la cantidad y calidad de tiempo que los estudiantes pasan con sus 
libros. Por tanto, “notas” es la variable dependiente y “tiempo” es la variable independiente. 


Variable dependiente Es la variable que se desea explicar o predecir; tambien se le 
denomina regresando o variable de respuesta. 


La variable independiente X se utiliza para explicar 7 


Variable independiente Es la variable independiente, tambien se le denomina variable 
explicativa o regresor 


Se dice que “7 esta regresando por X\ 

El primero en desarrollar el analisis de regresion fue el cientifico ingles Sir Francis Galton (1822 - 191 1). Sus 
primeros experimentos con regresion comenzaron con un intento de analizar los patrones de crecimiento hereditarios 
de los guisantes. Animado por los resultados, Sir Francis extendio su estudio para incluir los patrones hereditarios 
en la estatura de las personas adultas. Descubrio que los ninos que tienen padres altos o bajos tendian a 
“regresar” a la estatura promedio de la poblacion adulta. Con este modesto inicio el uso del andlisis de regresion 
se dio a conocer convirtiendose en una de las herramientas estadisticas mds poderosas que se encuentran 
disponibles actualmente. 

Se debe diferenciar entre la regresidn simple y la regresion multiple. En la regresion simple, se establece que 
7 es una funcidn de s61o una variable independiente. Con frecuencia se le denomina regresion bivariada porque 
s61o hay dos variables, una dependiente y una independiente, y la regresion simple se representa con la fdrmula 
(1 1 .1). En un modelo de regresion multiple, 7 es una funcion de dos o mds variables independientes. Un modelo 
de regresidn con k variables independientes se puede expresar asi: 


En un modelo de regresion multiple 



Y es una funcion de dos o mas 
variables independientes 

Y=f(X 1 , X 2 , X 3 , .... x k ) 

[11.2] 


en donde X } , X 2 , X 3 , X k son variables independientes que permiten explicar 7. 

Tambien es necesario hacer una distinci6n entre la regresidn lineal y la regresi6n curvilineal (no lineal) En 
modelo de regresidn lineal, la relacidn entre X y 7 puede representarse por medio de una linea recta. Sostiene que 
a medida que X cambia, 7 cambia en una cantidad constante. La regresidn curvilineal utiliza una curva para 
expresar la relacidn entre Xy 7. Sostiene que a medida que X cambia, 7 cambia en una cantidad diferente cada vez. 

Algunas de estas relaciones aparecen en la figura 1 1.1 y muestran diagramas de dispersion que representan 
las observaciones por pares para X y 7. Es habitual colocar la variable independiente en el eje horizontal. La figura 
11.1a) sugiere una relacion positiva y lineal entre X y 7. Es positiva porque Xy Y parecen mo verse en la misma 
direction. A medida que X aumenta (disminuye), 7 aumenta (disminuye). Es lineal porque la relacidn puede 
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Figura 11.1 

Diagramas 
de dispersion 





(e) 

Y 




Este diagrama de 
dispersion indica que no 
existe ninguna relacion 
entre X y Y 


X 


identificarse mediante una linea recta que se dibuja entre los puntos. La figura 1 LI b) muestra una relacion lineal 
y negativa entre X y Y y porque las dos variables parecen moverse en direcciones opuestas. Las figuras 11.1 c) y 
1 Lid ) indican relaciones curvilineales. El patron de los puntos de dispersion no se describe bien con la linea 
recta, pero se define de manera mas exacta con la curva que proporciona un mejor ajuste. Finalmente, es dificil 
observar toda relacion entre X y Yen la figura 1 1. 1 e). La ausencia de todo patron detectable sugiere que no existe 
ninguna relacion entre X y Y. 


Relaciones lineales y curvilineales Si Xy Yse relacionan en forma lineal, entonces a 
medida que X cambia, Y cambia en una cantidad constante. Si existe una relacion 
curvilinea, Y cambiara en una cantidad diferente a medida que X cambia. 


11.2 Determination del modelo de regresion lineal simple 

Este capitulo se concentrara en la regresion lineal simple. Solo son necesarios dos puntos para dibujar la linea 
recta que represents esta relacion lineal. La ecuacion de una recta puede expresarse como 
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Ecuacion de la recta Y=b o + b r X [11.3] 


en donde b o es el intercepto y b 1 es la pendiente de la recta. Por ejemplo se tiene que: 

y=5+2X 

entonces, como se observa en la figura 1 1 .2, la recta intersecta el eje vertical en 5 . Ademas, la pendiente de la recta 
se halla 


b 1 = pendiente 


variation vertical 


variation horizontal 1 
Por cada cambio de una unidad en X, Y cambia en dos unidades. 


= 2 


Figura 11.2 

Li'nea recta con 
pendiente positiva 



Vale la pena destacar que a medida que X incrementa de 2 a 3 (un incremento de una unidad), Y incrementa de 
9 a 1 1 (un incremento de dos unidades). La figura 11.3 a) muestra una grafica en la cual b t < 0, por ejemplo, 


L=10-5X 

Revela que existe una relation negativa tal entre X y Y que por cada incremento (reduction) de una unidad en X, 
Y reducira (aumentara) en 3 unidades. Si la pendiente de la recta es b x = 0 como en la figura 1 1.3 b), entonces un 
cambio de X no tiene relation con un cambio en Y. Por tanto, X no puede utilizarse como variable explicativa de Y. 


Figura 11.3 

Grafica de lineas 
recta s 


relaci6n negativa 
Xy Y 


A medida que X aumenta 
1 unidad y pasa de 2 a 3, 
Y baja 3 unidades de 4 a 1 



(b) No existe ninguna relacion 
y entre X y Y. A medida que X 
cambia, Y sigue igual 


K = 7 + 0X 



Las relaciones entre variables son o deterministicas o estocasticas (aleatorias). Una relacion deterministica 
puede expresarse mediante la formula que convierte la velocidad expresada en millas por hora (mph) a kilometros 
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por hora (kph). Ya que 1 milla es aproximadamente igual a 1 .6 kilo metros, este modelo es 1 mph =1.6 kph. Por tanto, 
una velocidad de 5 mph = 5(1.6) kph = 8.0 kph. Este es un modelo determimstico porque la relacion es exacta y no 
hay error (salvo la aproximacion). 

Infortunadamente, muy pocas relaciones en el mundo de los negocios son asi de exactas. Con frecuencia se 
encuentra que al utilizar una variable para explicar otra, existe alguna variacion en la relacion. Por ejemplo, se 
supone que la gerencia de Vita + Plus, Inc., distribuidores de productos para la salud, desea desarrollar un modelo 
de regresidn en el cual se utiliza la publicidad para explicar los ingresos por concepto de ventas. Probablemente 
encontraran que cuando hacen publicidad y esta se fija en cierta cantidad X, las ventas tendran algun valor Y.. Sin 
embargo, la proxima vez que se fije la publicidad en la misma cantidad, las ventas pueden producir otro valor. La 
variable dependiente (ventas, en este caso) presenta algun grado de aleatoreidad. Por tanto, habra algun error en 
el intento por explicar o predecir las ventas. Se dice que un modelo de esta naturaleza es estocistico, por la 
presencia de la variacion aleatoria y puede expresarse como 


Un modelo lineal Y = /3 0 + /3,x + e [11.4] 


La formula (11.4) es la relacion poblacional (o verdadera) segun la cual se hace regresion de Y sobre X. 
Ademas, p () + [31 (X) es la portion determimstica de la relacion, mientras que e (la letra griega epsilon) representa 
el caracter aleatorio que muestra la variable dependiente y por tanto denota el termino del error en la expresion. 
Los parametros P 0 y P r lo mismo que la mayoria de los parametros, permaneceran desconocidos y se pueden 
estimar solo con los datos muestrales. Esto se expresa ask 


Un modelo lineal con base 
en datos muestrales 


Y = b 0 + b x X + e 


[11.5] 


en donde los valores b Q y b x son estimaciones de P 0 y P t , respectivamente, y e es el termino aleatorio. Habitualmente 
se le denomina residual cuando se utilizan datos muestrales, e reconoce que no todas las observaciones caen 
exactamente en una linea recta. Si se supiera el valor exacto de e , se podrfa calcular de manera precisa Y. Sin 
embargo, debido a que e es aleatoria, Y solo puede estimarse. El modelo de regresion por ende toma la forma de: 


El modelo de regresion 
estimada 


[ 11 . 6 ] 


en donde Y (que se lee como Y sombrero) es el valor estimado de L, y b Q y b ] son el intercepto y la pendiente de la 
recta de regresion estimada. Es decir, Y simplemente es el valor estimado para las ventas con base en el modelo de 
regresion. 


11.3 Mi'nimos cuadrados ordinarios: La recta 
de mejor ajuste 

El proposito del analisis de regresion es determinar una recta que se ajuste a los datos muestrales mejor que 
cualquier otra recta que pueda dibujarse. Para ilustrarlo, se asume que Vita + Plus, Inc., recolecta datos sobre los 
gastos publicitarios y los ingresos por ventas de 5 meses, como se muestra en la tabla ILL 
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Tabla 11.1 

Datos de ventas 
para Vita + Plus, Inc. 


Mes 

Ventas (X US$1000) 

Publicidad (X US$100) 

1 

US$450 

US$50 

2 

380 

40 

3 

540 

65 

4 

500 

55 

5 

420 

45 


Aunque una muestra de solo 5 datos probablemente serfa insuficiente, servira por el momento para los propositos 
de los autores. 

Estos cinco datos y la recta que mejor les ajusta aparecen en la figura 11.4. Esta recta esta determinada 
mediante la estimation de b 0 y b y Un procedimiento matematico utilizado para estimar esos valores se denomina 
minimos cuadrados ordinarios (MCO). MCO producira una recta que se extiende por el centro del diagrama de 
dispersion aproximandose a todos los puntos de datos mas que cualquier otra recta. Regresando a la figura 1 1 .4, 
para los 5 datos Y. en el diagrama de dispersion son los valores de los datos observados reales para Y en la tabla 
11.1. Los valores Y se obtienen mediante la recta de regresion y representan el estimado de las ventas. La 
diferencia entre lo que Y era realmente, Y., y lo que se estima que es Y., es el error. 


Figura 11.4 

Datos para Vita + 
Plus, Inc. 



El termino del error es la diferencia 



entre los valores reales de Y(Y), y 
el estimado de Y(Y). 

Error = (y. - Y) 

[11.7] 


Si el valor real de Y, 7 , es mayor que el estimado, entonces (7, — Y) y el error es positivo. Este es el caso en la figura 
1 1.4, en donde la publicidad es 55. Por el contrario, si se sobrestiman las ventas, entonces f(7 ( — 7.) el error es 
negativo. Esto ocurre cuando la publicidad es 50. Debido a que algunos errores son negativos y algunos son 
positivos, MCO producira una recta tal que la suma de esos errores sea cero: 
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2(r, - Y) = 0 


MCO tambien asegurara que se minimice la suma de estos errores al cuadrado. Es decir, si se toman cinco 
diferencias, todas verticales, entre los valores reales de Y y la recta de regresion (Y i — Y), se elevan al cuadrado 
estas diferencias verticales y se suman, el numero resultante sera menor que el que se obtendrfa con cualquier otra 
recta. Es decir, MCO minimizara la suma de los errores al cuadrado. Es por esto que se denomina mfnimos 
cuadrados ordinarios; produce una recta tal que la suma de los errores al cuadrado es menor de lo que serfa con 
cualquier otra recta. Ver formula [11.8] 


La suma de errores al 
cuadrado se minimiza 


2(y ; - Y) 1 = min 


[ 11 . 8 ] 


en donde ( Y i — Y t ), es el error de cada dato y min es el valor mmimo. 

Para determinar esta recta de mejor ajuste , MCO requiere que se calcule la suma de cuadrados y productos 
cruzados. Es decir, se debe calcular la suma de los valores de X al cuadrado (SOc), la suma de los valores de Y al 
cuadrado (SCy) y la suma de X multiplicado por Y (SCxy). Esto se muestra en las formulas (1 1.9) a (1 1. 1 1). 


Suma de los cuadrados 
deX 

SCx = 2<X, - X) 1 

- 2X’ - 

n 

[11.9] 


Suma de los cuadrados 
de Y 

SCy = 2(y,. - Y) 2 

- ^ 

n 

[11.10] 

y 

Suma de los productos 
cruzados de Xy Y 

sexy - ax, - x)(r, - n 

= 2X. - <SfXE » 
n 

[11.11] 


Vale la pena notar que las primeras porciones de cada una de estas formulas 


SCx = 2(X, - X) 2 
SCy = 2(7, - Y) 2 

y 

SCxy = 2(x,. - X)(r,. - Y) 


ilustran c6mo la recta MCO realmente se basa en las desviaciones de las observaciones a partir de su media. Por 
ejemplo, SCx se halla 1) calculando la cantidad en la cual cada una de las observaciones de X(X. ) se desvia de su 
media (X), 2) elevando al cuadrado tales desviaciones, y 3) sumando tales desviaciones al cuadrado. Sin embargo, 
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estos calculos son muy tediosos cuando se realizan manualmente. Por tanto, se utilizara generalmente la segunda 
version de cada una de estas formulas al hacer los calculos. 

Dadas las sumas de cuadrados y los productos cruzados, es un asunto sencillo calcular la pendiente de la 
recta de regresion, llamada el coeficiente de regresion y el intercepto, asf: 


La pendiente de la 
recta de regresion 

_SCxy 

1 SCx 

[11.12] 

y 

El intercepto de 

b n = Y - b.X 

[11.13] 

la recta de regresion 




en donde YyX son las medias de los valores Y y los valores X . 

Cuidado! Estos calculos son extremadamente sensibles a la aproximacion. Esto es especialmente cierto para 
el calculo del coeficiente de determination, lo cual se demostrara mas tarde en este capitulo. Por tanto, se aconseja 
en aras de la exactitud, efeetuar los calculos hasta con cinco o seis cifras decimales. 


Ejercicios de la seccion 


1. ^Cual es la diferencia entre la regresion simple y la regresion multiple? 

2. ^Cual es la diferencia entre la regresion lineal y la regresion curvilinea? ^Como cambia Y cuando X cambia en 
cada caso? 

3. Diferencie entre los componentes estocasticos y aleatorios de un modelo de regresion. 

4 . ^Por que el metodo de minimos cuadrados ordinarios para determinar el modelo de regresion se denomina 
“minimos cuadrados ordinarios”? ^Que papel juega el error en este analisis? 

5. Identifique la variable dependiente y la independiente en cada uno de estos casos 

a. El tiempo que se pasa trabajando en una composition y la nota obtenida. 

b. La estatura del hijo y la estatura del padre. 

c . La edad de una mujer y el costo de su seguro de vida. 

d. El precio de un producto y el numero de unidades vendidas. 

e. La demanda de un producto y el numero de consumidores en el mercado. 

6. Dados los siguientes datos para X y Y: 

X 28 , 54 , 67 , 37 , 41 , 69 , 76 
Y 14 , 21 , 36 , 39 , 18 , 54 , 52 








332 ESTADiSTICAAPUCADAALOSNEGOCIOSYLAECONOMIA 


a. Haga un diagrama de dispersion para los datos. 

b. i Que sugieren los datos sobre una relacion entre X y Y? 

c. Haga una recta para aproximar la relacion. 

7. ^Cual es la diferencia entre Y y Y. en el analisis de regresion? 

8. ^Que es el termino e en el modelo de regresion y por que ocurre? 


11.4 Ejemplo utilizando MCO (rmnimos cuadrados 
ordinarios) 

La gerencia de Hop Scotch Airlines, la aerolmea transportadora mas pequena del mundo, considera que existe una 
relacion directa entre los gastos publicitarios y el numero de pasajeros que escogen viajar por Hop Scotch. Para 
determinar si esta relacion existe, y si es asi cual podrfa ser la naturaleza exacta, los estadisticos empleados por 
Hop Scotch decidieron utilizar los procedimientos MCO para determinar el modelo de regresion. 

Se recolectaron los valores mensuales por gastos de publicidad y numero de pasajeros para los n = 15 meses 
mas recientes. Los datos aparecen en la tabla 11.2, junto con otros calculos necesarios para hallar el modelo de 
regresion. Se observara que los pasajeros estan representados con la variable Y, ya que se asume que depende de 
la publicidad. 


Tabla 11.2 

Observacion 

Publicidad 

Pasajeros 




Datos de 
regresion para 
Hop Scotch 

(mes) 

(en US$1,000‘s) 

m 

(en 1,000's) 

O') 

XY 

X 2 

Y 2 

1 

10 

15 

150 

100 

225 

Airlines 

2 

12 

17 

204 

144 

289 


3 

8 

13 

104 

64 

169 


4 

17 

23 

391 

289 

529 


5 

10 

16 

160 

100 

256 


6 

15 

21 

315 

225 

441 


7 

10 

14 

140 

100 

196 


8 

14 

20 

280 

196 

400 


9 

19 

24 

456 

361 

576 


10 

10 

17 

170 

100 

289 


11 

11 

16 

176 

121 

256 


12 

13 

18 

234 

169 

324 


13 

16 

23 

368 

256 

529 


14 

10 

15 

150 

100 

225 


15 

12 

16 

192 

144 

256 



187 

268 

3 r 490 

2,469 

4,960 


Con este simple conjunto de datos, y los calculos subsiguientes para XY , X 2 , y Y 2 , es tarea facil determinar el 
modelo de regresion mediante el calculo de los valores de la constante de regresion y el coeficiente de regresion 
de la recta de regresion Y = b o + b^X. Las sumas de los cuadrados y de los productos cruzados son: 
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sa-ix‘-Z2 

n 

(187) 2 
= 2,469 - y- 

= 137.7333333 

J n 

(268) 2 

= 4,960 - 
= 171.733333 

n 


Utilizando la formula ( 1 1 . 1 2) se puede establecer el coeficiente de regresion asi: 

, _ SCxy 
' SCx 
_ 14 8.933 333 
~ 137.733333 
= 1.0813166 o 1.08 


Debido a que 


y 



268 

15 


17.86667 


- 2X 187 

X ~ — = = 12.46667 

n 15 


La formula (11.13) revela que el intercepto es: 

b 0 = Y — b~X 

= 17.866667 - 1.08(12.46667) 
= 4.3865 o 4.40 

El modelo de regresion entonces es: 

Y, = 4.40 + 1.08AT, 


en donde Yje s el valor individual pronosticado para los pasajeros. Asi, si X es igual a 10, tendremos: 

Yj = 4.40 + 1.08(10; = 15.2 


Debido a que tanto X como Y estan expresadas en miles, esto significa que si se gastan US$10,000 en publicidad, 
el modelo predice que 15,200 personas valientes decidiran volar en Hop Scotch Airlines. El coeficiente de 1.08 
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significa que por cada incremento de una unidad en X, Y aumentara en 1 .08 unidades. Por tanto, si se incrementan 
los gastos publicitarios en US$1,000, entonces 1.080 pasajeros mas abordaran aviones de Hop Scotch. 

Yj = 4.40 + 1.08(11) = 16.28 

La figura 11.5 muestra la recta de regresion que se ha estimado. El intercepto es 4.40 y se indica una pendiente 
positiva. La pantalla 1 1. 1 es una impresion parcial en Minitab. El intercepto o constante, como se denomina en 
Minitab, es 4.3863 y el coeficiente para la publicidad es 1 .08. En breve se analizaran algunas de las estadfsticas que 
aparecen impresas. La recta ajustada aparece en la pantalla de Minitab numero 1 1 .2. Vale la pena notar que la recta 
pasa por la mitad del diagrama de dispersion. 


Figura 11.5 

Recta de regresion 
para Hop Scotch 
Airlines 



Publicidad (Adv) 


Pantalla de Minitab 11.1 

Regression Analysis (Analisis de regresion) 


The Regression 

equation is 

(La ecuacion de 

regresion 

es ) 

PASS = Pasajeros 

PASS = 4.39 + 

1.08 ADV 




Stdev = Desviacion 






estandar 

Predictor 

Coef 

Stdev t- 

-ratio 

P 

t-radio = Razon t 

Constant 

4.3863 

0.9913 

4.42 

0.001 

R-sq = r 2 

ADV = Publicidad 

ADV 

1.08132 

0.07726 

13.99 

0.000 


s = 0.9068 

R-sq = 93.8% 

R-sq (adj) 

= 93.3% 




Pantalla de Minitab 11.2 


Recta de regresion 



Y = 4.38625 + 1.08132X 
r 2 = 0.938 
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Ejercicios de la section 


9. El centro de ubicacion laboral en State University desea determinar si los promedios puntuales en notas de 
los estudiantes (GPAs) puede explicar el numero de ofertas laborales que ellos reciben despues de graduarse. 

Los datos siguientes corresponden a los 10 recien graduados. 

Estudiante 1 2 3 4 5 6 7 8 910 

GPA 3.25 2.35 1.02 0.36 3.69 2.65 2.15 1.25 3.88 3.37 

Ofertas 3310542262 


a. Haga un diagrama de dispersion para los datos. 

b . Calcule e interprete el modelo de regresion. ^Que le dice este modelo sobre la relacion entre GPA y las 
ofertas de trabajo? 

c. Si Steve tiene un GPA de 3.22, ^cuantas ofertas laborales pronostica usted que el recibira? 

10. Un economista del Departamento de Recursos Humanos de Florida State esta preparando un estudio sobre 
el comportamiento del consumidor. El recolecto los datos que aparecen en miles de dolares para determinar si 
existe una relacion entre el ingreso del consumidor y los niveles de consumo. Determine cual es la variable 
dependiente. 


Consumidor 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Ingreso 

24.3 

12.5 

31.2 

28.0 

35.1 

10.5 

23.2 

10.0 

8.5 

15.9 

14.7 

15 

Consumo 

16.2 

8.5 

15 

17 

24.2 

11.2 

15 

7.1 

3.5 

11.5 

10.7 

9.2 


a. Haga un diagrama de dispersion para los datos. 

b. Calcule e interprete el modelo de regresion. ^Que le dice este modelo sobre la relacion entre el consumo y 
el ingreso? ^Que proportion de cada dolar adicional que se gana se invierte en consumo? 

c. iQue consumo pronosticana el modelo para alguien que gana US$27,500? 

11. Un banco en Atlanta que se especializa en creditos para vivienda intenta analizar el mercado de finca raiz, 
midiendo el poder explicativo que las tasas de interes tienen sobre el numero de casas vendidas en el area. Se 
compilaron los datos para un perfodo de 10 meses, asi: 


Mes 1 23456789 10 

Interes 12.3 10.5 15.6 9.5 10.5 9.3 8.7 14.2 15.2 12 

Casas 196 285 125 225 248 303 265 102 105 114 

a . Haga un diagrama de dispersion para los datos 

b. Calcule e interprete el modelo de regresion. ^Que le dice este modelo sobre la relacion entre las tasas de 
interes y las ventas de vivienda? 

c. Si la tasa de interes es del 9.5%, ^cuantas casas se venderfan de acuerdo con el modelo? 

12. Overland Group produce partes para camidn que se utilizan en los semirremolques. El jefe de contabilidad 
desea desarrollar un modelo de regresidn que pueda utilizarse para predecir los costos. El selecciona unidades 
de produccidn fabricadas como una variable de prediccidn y recolecta los datos que se observan aquf. Los 
costos estdn en miles de ddlares y las unidades en cientos. 
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Unidades 12.3 8.3 6.5 4.8 14.6 14.6 14.6 6.5 

Costo 6.2 5.3 4.1 4.4 5.2 4.8 5.9 4.2 

a. Haga un diagrama de dispersion para los datos. 

b. Calcule e interprete el modelo de regresion. ^Que le dice el contador sobre la relation entre production y 
costos? 

c. Segun el modelo, ^cuanto costarfa producir 750 unidades? 

13 . El profesor Mundane ha notado que muchos de sus estudiantes se han ausentado de clase este semestre. 
Considera que puede explicar esta falta de asistencia por las distancias a las que sus estudiantes viven del 
campus. Se practica una encuesta a once estudiantes sobre cuantas millas deben viajar para asistir a clase y 
el numero de clases a las que han faltado. 

Millas 56209 12 16 5708 

Ausencias 2245425231 4 

a. Haga un diagrama de dispersion para los datos. 

b. Compare e interprete el modelo de regresion. ^Que determina el profesor? 

c. cuantas clases faltarfa usted si vi viera a 3.2 millas del campus, segun el modelo? 

14 . El director administrative de Bupkus, Inc., obtuvo datos sobre 100 empleados respecto a las pruebas de 
ingreso que se les practico en el momento de la contratacion y las calificaciones subsiguientes que recibieron 
los empleados por parte del supervisor un ano despues. Los puntajes del examen oscilaron entre 0 y 10 y la 
calificacion era sobre un sistema de 5 puntos. El director intenta utilizar el modelo de regresion para predecir 
la clasificacion ( R ) que recibiran con base en el puntaje del examen (5). Los resultados son: 

2S = 522 ZR = 326 2SR = 17,325 
2S 2 = 28,854 y 2/? 2 = 10,781 

Desarrolle e interprete el modelo de regresion. ^Que puede predecir el director respecto a la clasificacion de un 
empleado que obtuvo 7 en el examen? 

Nota: Mantenga sus calculos de los ejercicios 9 a 14 para utilizarlos durante el resto de este capitulo. 
Utilizando los mismos datos usted evitara tener que calcular SCx , SCy, y SCxy cada vez. Usted ganara 
experiencia adicional con otros problemas al final del capitulo. 


11.5 Supuestos del modelo de regresion lineal 

Para comprender mejor el modelo lineal se deben examinar los cuatro supuestos sobre los cuales se construye. 

Supuesto 1: El termino de error £ es una variable aleatoria distribuida normalmente. 

Como se dijo anteriormente, si se fija que X es igual a un valor dado muchas veces, los valores resultantes de 
F variaran. Note las observaciones 1 , 5, 7, 10 y 14 de la tabla 1 1 .2. En cada caso X = 10. Sin embargo, Y[ es diferente 
cada vez. Algunas veces F esta por encima de la recta de regresion haciendo que el termino de error (F - F/) sea 
positivo mientras que en otros momentos F es menor que F/ , creando un error negativo. Se asume que estos 
terminos de error se distribuyen normal y aleatoriamente alrededor de la recta de regresion poblacional. Esto se 
muestra en la figura 1 1 .6 para un valor X de 10. 
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Figura 11.6 

La distribucion normal 
de los valores 
y alrededor de la 
recta de regresion 
poblacional 
desconocida 


La varianza en todos los 
valores Y donde X = 10 


La varianza en todos los 
valores Y. en donde X - 1 1 



Publicidad 


Debido a que Y. es diferente cada vez, lo mejor que la recta de regresion puede hacer es estimar el valor 
promedio de Y. Por tanto, la recta de regresion poblacional pasa por la media de aquellos valores Y en donde X = 
10. Este punto se indica como p y )x _ 10 en la figura 1 1 .6. Alii se observa una distribucion normal de los terminos de 
error por encima y por debajo de la recta de regresion. Lo mismo ocurrina si se tuviera X = 1 1 muchas veces. 
Resultarfan muchos valores Y diferentes. Estos valores Y estan distribuidos normalmente por encima y por debajo 
de la recta de regresion y pasan a traves de la media de dichos valores donde X = 11, |X Y(x=n . 


Supuesto 2: Varianzas iguales de los valores K 

El modelo MCO asume que la varianza en los valores Y es la misma para todos los valores de X. Esto tambien 
se muestra en la figura 1 1 .6. La variation en los valores Y por encima y por debajo de la recta de regresion en donde 
X = 10 es igual a la variacidn en los valores Y en donde X = 11. Esto es cierto para todos los valores de X. Este 
supuesto se denomina homoscedasticidad. 


Homoscedasticidad Las varianzas en los valores Y son las mismas en todos los 
valores de X 


Desafortunadamente, este supuesto se contraviene con frecuencia cuando se trabaja con datos de corte 
seccional. Por ejemplo, se asume que se desea desarrollar un modelo de regresion en el cual los ingresos de los 
consumidores se utilicen para predecir o explicar sus gastos de consumo, Cons =/(Ing). Si se recolectaran datos 
sobre los consumidores en diferentes intervalos de ingreso durante un ano dado se estarfan utilizando datos de 
corte seccional ya que se incluyeron las observaciones a traves de diferentes secciones de estrato de ingresos; 
los pobres, el promedio y los ricos. Como lo muestra la figura 1 1.7, se puede encontrar un rango muy estrecho en 
los valores para el consumo en los niveles bajos de ingreso, mientras que para los consumidores mas ricos, la 
variacidn en sus gastos de consumo es mucho mayor. Los valores 7 se dispersan mas ampliamente a medida que 
el ingreso incrementa. Esto es lo que se denomina heteroscedasticidad. 
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Los valores Y se dispersan mas ampliamente para 


Figura 11.7 

Heteroscedasticidad 
en la varianza de los 
valores Y 



Supuesto 3: Los terminos de error son independientes uno del otro. 

MCO se basa en el supuesto de que los terminos de error son independientes uno del otro. El termino de error 
encontrado para un valor de Y., no se relaciona con el termino de error para cualquier otro valor de Y . Esta hipotesis 
puede probarse analizando un diagrama de los errores de los datos muestrales. Si no puede observarse ningun 
patron se puede asumir que los terminos de error no se relacionan. 

Pantalla en Minitab 11.3 


Residual Data for Hop Scotch (Datos residuales de Hop Scotch) 


ADV 

PASS 

Y-HAT 

RESID 

10 

15 

15.1994 

-0.19942 

12 

17 

17.3621 

-0.36215 

8 

13 

13.0368 

-0.03679 

17 

23 

22.7686 

0.23137 

10 

16 

15.1994 

0.80058 

15 

21 

20.6060 

0.39400 

10 

14 

15.1994 

-1.19942 

14 

20 

19.5247 

0.47532 

19 

24 

24.9313 

-0.93127 

10 

17 

15.1994 

1.80058 

11 

16 

16.2807 

-0.28074 

13 

18 

18.4434 

-0.44337 

16 

23 

21.6873 

1.31268 

10 

15 

15.1994 

-0.19942 

12 

16 

17.3621 

-1.36205 


ADV = Advertising o publicidad 
Pass = Passanger o pasajeros 
Y-HAT = § 

RESID = ERROR 


§ 0 



ADV 
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El diagrama de los errores y sus valores para los datos de Hop Scotch se muestran en la pantalla 1 1.3 de 
Minitab. Es diffcil detectar algun patron discernible. Esto sugiere que los errores realmente son independientes. 
Se compara esto con un diagrama residual que puede aparecer como figura 1 1.8 a). Es evidente que los errores no 
son aleatorios y que estan relacionados claramente. El patron comienza con varios errores positivos, seguidos 
por varios errores negativos, y luego nuevamente varios errores positivos. Por el contrario, si se tuviera que 
lanzar una moneda varias veces, <,se obtendnan varias caras seguidas de varios sellos y luego nuevamente varias 
caras? Es altamente improbable. Mientras que los lanzamientos de la moneda son eventos independientes, estos 
residuales no lo son. Estan relacionados. Se puede decir que el valor de un error es una funcion del error anterior. 
Es mis probable que un error positivo sea seguido por otro error positivo, mientras que un error negativo esta 
relacionado con un segundo error negativo. Tal condicion, la cual contraviene el supuesto de independencia de 
errores, se denomina autocorrelation positiva porque los signos iguales se agrupan. La autocorrelacion negativa 
se representa en la figura 11.8b). Cada error es seguido de un error de signo opuesto. Este patron de signos 
altemantes sugiere que los terminos de error no son independientes. 


Figura 11.8 

Posibles diagramas 
de errores 






Un patron con errores como 
este sugiere una 
autocorrelacion positiva 



• ••• 


x 


(b) 


• • • • 


0 





Cuando un error esta 
seguido por otro error de 
signo opuesto, se indica 
autocorrelacion negativa 


Autocorrelacion Ocurre cuando los terminos de error no son independientes. 


En realidad, los diagramas residuales nunca son tan obvios o tan faciles de leer como lo pueden sugerir los 
diagramas anteriores. Afortunadamente existe una forma mas confiable para detectar la autocorrelacion con base 
en la prueba de Durbin- Watson. Es mas probable que la autocorrelacion ocurra en el uso de datos de series de 
tiempo en los cuales, a diferencia de los datos de corte seccional discutidos anteriormente, las observaciones de 
alguna variable se recolectan durante varios perfodos (semanas, meses, anos, etc.). Por ejemplo, se pueden 
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compilar datos para la tasa de desempleo mensual durante varios meses. Estos datos difieren de los datos de corte 
seccional, los cuales se recolectan para algun punto especffico en el tiempo. El estadfstico de Durbin- Watson se 
calcula asi 


Estadfstico de Durbin-Watson 


2(e f ~ 


e ,-,) 2 


Se? 


[11.14] 


en donde e t es el error en el perfodo de tiempo t y e tJ es el error en el perfodo anterior. La formula (11.14) requiere 
que el termino de error (Y. - Yj ) se calcule para cada perfodo y es muy diffcil calcularlo manualmente. Un computador 
en Minitab revelo que el estadfstico de Durbin-Watson para los datos Hop Scotch es de 2.48. Este valor se utiliza 
para probar la hipotesis de que no existe correlacion entre terminos de error sucesivos, asf: 


H 0 : Pe„e,^ “ 0 (No existe autocorrelacion) 

H a : p e e # 0 (Existe autocorrelacion) 

en donde p es el coeficiente de correlacion para errores sucesivos. El valor Durbin-Watson se compara con los 
valores crfticos tornados de la tabla K del apendice III, para un nivel de significance del 1 o del 5%. Se supone que 
se selecciona un valor a del 1 % . Dado que n = 1 5, y k el numero de variables independientes es 1 , el valor Durbin- 
Watson inferior es d L = 0.81, y el valor superior Durbin-Watson es d v = 1.07. Estos valores se aplican entonces a 
la escala en la figura 11.9. Si el valor Durbin-Watson es menor que d L = 0.81, se sugiere una autocorrelacion 
positiva y se rechaza la hipotesis nula. Si es mayor que (4 - dj = 3.19, se sugiere la autocorrelacion negativa y se 
rechaza la hipotesis nula. Si esta entre d u = 1 .07 y (4 - d v ) = 2.93, no se rechaza la hipotesis nula. Si el valor Durbin- 
Watson cae en cualquiera de las dos regiones restantes, la prueba no es conclusiva. En este caso particular, el 
valor Durbin-Watson de 2.48 cae en la region de la escala que indica que la correlacion no existe y no se rechaza 
la hipotesis nula. Generalmente hablando, si el valor Durbin-Watson es cercano a 2, no se rechaza la hipotesis 
nula. 


Figura 11.9 

Una prueba 
Durbin-Watson 


+AC 


d L = 0.81 


Sin autocorrelacion 


4 = 1.07 


f 1 

2 i 4-4 = 2.93 
I 


2.48 


-AC 


4-4 = 3.19 


Supuesto 4: El supuesto de linealidad. 

Como se expreso en el supuesto 1, si X se deja igual que un valor muchas veces, ocurrira una distribucion 
normal de los valores Y. Esta distribucion tiene una media, jjy ^ Esto es cierto para todo valor de X. MCO asume 
que estas medias quedan en una recta, como se sugirio anteriormente en la figura 1 1.6. 


Ejercicios de la seccion 


15. ^Que se entiende por homoscedasticidad y heteroscedasticidadl Haga los graficos apropiados para ilustrar 
estos dos terminos. 

16. ^Que se entiende por autocorrelacion? Diferencie entre una autocorrelacion positiva y una autocorrelacion 
negativa . Realice las graficas que representan estos dos tipos. 
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17. Explique claramente como se utiliza la prueba de Durbin- Watson para probar la autocorrelation. Incluya una 
discusion de la naturaleza de la formula utilizada para calcular el estadfstico Durbin- Watson. 

18. ^Cual es la naturaleza del supuesto de linealidad sobre el modelo MCO? 


11.6 El error estandar de estimacion: Una medida 
de bondad de ajuste 

La recta de regresion, como ya se ha dicho, con frecuencia se le denomina la recta del ajuste optimo. Se ajusta o 
representa la relation entre X y Y mejor que cualquier otra recta. Sin embargo, debido a que simplemente proporciona 
el mejor ajuste, no existe garantfa de que sea buena. A los autores les encantarfa poder medir que tan bueno es el 
mejor ajuste. 

En realidad, hay por lo menos dos medidas de bondad de ajuste: 1) el error estandar de estimacion, y 2) el 
coeficiente de determination. Por ahora veremos el analisis de este ultimo concepto hasta que mas adelante, en 
este capftulo, se estudie el analisis de correlation. Trataremos la description del error estandar de estimacion en 
este momento. 

El error estandar de estimacion, Se, es una medida del grado de dispersion de los valores Y. alrededor de la 
recta de regresion. Mide la variacion de los puntos de datos por encima y por debajo de la recta de regresion. 
Refleja la tendencia a desviarse del valor real de Y cuando se utiliza el modelo de regresion para fines predictivos. 
En este sentido, es una medida del error “tipico” 

Si todos los puntos de datos se situaran perfectamente sobre una recta como en la figura 11.10 a), la recta de 
regresion pasarfa por cada uno. En este caso afortunado no se presentaran errores en los pronosticos, y el error 
estandar de estimacion serfa cero. Sin embargo, los datos rara vez son asi de cooperatives y usualmente habra 
alguna dispersion en los datos como en la figura 11.10 b). El error estandar de estimacion mide esta variacion 


Figura 11.10 

Diagramas 
de dispersion 
posibles 




promedio de los puntos de datos alrededor de la recta de regresion que se utiliza para estimar Y y por ende 
proporciona una medida del error que se presentara en dicha estimacion. La formula (11.15) ilustra este principio. 
Vale la pena destacar que el numerador refleja la diferencia entre los valores reales de Y, Y., y el estimado Y ( ; 


El error estandar ^ fay. - y) 2 

de estimacion Se ~ y ~ n 2 


[11.15] 
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Desafortunadamente, la formula ( 1 1 . 1 5) no es conveniente a nivel computacional. Es necesario disponer de un 
metodo mas facil de calculo manual. Vale la pena recordar que a 2 es la varianza de los errores de regresion. Uno 
de los supuestos basicos del modelo MCO es que esta varianza en los errores alrededor de la recta de regresion 
es la misma para todos los valores de X. Entre menor sea el valor de a 2 , menor sera la dispersion de los puntos de 
datos alrededor de la recta. 

Debido a que a 2 es un parametro, probablemente permanecera desconocida, y es necesario estimar su valor 
con los datos muestrales. Una estimacion insesgada de <7 2 es el cuadrado medio del error {CME). En el capitulo 
anterior sobre ANOVA , se aprendio que el CME es la suma del cuadrado del error (SCE) dividida por sus grados 
de libertad. A diferencia del analisis de regresion, SCE es 


La suma de cuadrados 
, . SCE 

del error 

(SCxy) 2 

= SCc 

[11.16] 

En un modelo de regresion simple, se imponen dos restricciones en el conjunto de datos, debido a que se 
deben estimar dos parametros, P 0 y P r Por tanto hay n- 2 grados de libertad y CME es: 

Cuadrado medio del error 

CME= SCE 
n — 2 

[11.17] 

El error estandar de estimacion es entonces 

El error estandar 

Se = y/CME 

[11.18] 


En el caso actual de Hop Scotch Airlines, se tiene que: 


SCE 


SCy 


{sc xy f 


sc 


X 


= 171.7333 


(148.9333) 2 

137.73333 


CME = 


10.6893 
10.6893 
15-2 
0.82226 
V0.82226 
0.90678 o 


0.907 
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La pantalla de Minitab 1 1 .4 muestra que el error estandar es 0.9068. 


Pantalla en Minitab 11.4 

Regression Analysis (Analisis de regresion) 


The regression equation is (La 

PASS = 4.39 + 1.08 ADV 

ecuacion de regresion 

es) 

Pass 

Adv 

= Pasajeros 

= Publicidad 

Predictor 

Coef 

Stdev t-ratio 

P 

Stdev 

= Desviacion 

estandar 

Constant 

4.3863 0 

.9913 4.42 

0.001 

t-ratio 

= razon t 

ADV 

1.08132 0. 

07726 13.99 

0.000 

R-sq 

= r 2 

s = 0.9068 

R-sq = 93. £ 

3% R-sq ( ad j) 

= 93.3% 

DF 

= Grados 

de liber tad 





SS 

= Suma 

Analysis of 

Variance (Analisis 

de varianza) 



de cuadrados 





MS 

- Cuadrado medio 

SOURCE 

DF SS 

MS F 

P 

Fit 

= Ajuste 

Regression 

1 161.04 

161.04 195.86 

0.000 

Cl 

= Intervalo 

Error 

13 10.69 

0.82 



de confianza 

Total 

14 171.73 






Unusual Observations 

obs. ADV PASS Fit Stdev.Fit Residual St.Resid 

10 10.0 17.000 15.199 0.302 1.801 2. HR 

R denotes an obs. with a large st. resid. 

Durbin-Watson statistic = 2.48 

Fit Stdev.Fit 95.0% C.I. 95.0% P.I. 

15.199 0.302 (14.547, 15.852) (13.134, 17.265) 

MTB > 


El error estandar siempre se expresa en las mismas unidades que la variable dependiente F, en este caso miles 
de pasajeros. Por tanto, el error estandar de 0.907, o 907 pasajeros mide la variabilidad de los valores F alrededor 
de la recta de regresion ajustada. 

El error estandar de estimacion es muy similar a la desviacion estandar de una sola variable que se analizo en 
el capitulo 3. Si se recolectaran datos sobre los ingresos de n = 100 personas, se podria calcular facilmente la 
desviacion estandar. Esto proporcionana una medida de dispersion de los datos de ingresos alrededor de su 
media. 

En analisis de regresidn se tienen dos variables, X y F. El error estdndar de estimacion es una medida de la 
dispersidn de los valores Y alrededor de su media, dado un valor X especffico. 

Como el error est&ndar de estimacidn es similar a la desviacion est&ndar para una sola variable, puede 
interpretarse de manera similar. Vale la pena recordar que la regia empfrica establece que si los datos est£n 
distribuidos normalmente, un intervalo de una desviacidn est&ndar por encima de la media y una desviacidn 
estdndar por debajo de la media comprenderd el 68.3% de todas las observaciones; un intervalo de dos desviaciones 
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estandar a cada lado de la media contiene el 95.5% de las observaciones; y tres desviaciones estandar a cada lado 
de la media comprenden el 99.7% de las observaciones. 

Lo mismo puede decirse del error estandar de estimacion. En el ejemplo actual, en donde X = 10, 

y, = 4.4 + 1.08(10) 

= 15.2 

Vale la pena recordar que este valor de 15.2 es el estimado del valor promedio que se obtendrfa para Y si se 
determinara que X es igual a 10 muchas veces. Para ilustrar el significado del error estandar de estimacion, se 
localizan los puntos que estan a un Se (es decir, 0.907) por encima y por debajo del valor promedio de 15.2. Estos 
puntos son 14.29 (15.2- 0.907) y 16.11 ( 15.2 + 0.907). Si se trazan las rectas pasando por cada punto paralelo a la 
recta de regresion como en la figura 11.11, aproximadamente el 68.3% de los puntos de datos caeran dentro de 
estas rectas. El 31.7% de las observaciones restantes estardn fuera de este intervalo. En este caso, el 68.3% de las 
veces cuando se invierte US$ 10,000 en publicidad, el numero de pasajeros estara entre 14,290 y 1 6, 1 1 0. El 3 1 .7% 
del tiempo restante, el numero de pasajeros excedera de 16,1 10 o sera menor que 14,290. 

Figura 11.11 

Error estandar 
de estimacion 


to x 



Dada esta interpretation de Se, se deduce que entre mas dispersos esten los datos originales, mayor sera Se. 
Los datos para la figura 11.12a) estan mucho mas dispersos que los de la figura 1 1 . 1 2 b) . El Se para la figura 11.12a) 
por tanto, serfa mayor. Despues de todo, si se van a involucrar el 68.3% de las observaciones a un Se de la recta 
de regresion, el intervalo debe ser mas amplio si los datos estan mas dispersos. 


Figura 11.12 

Una comparacion 
del error estandar 
de estimacion 




x 


x 
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Ejercicios de la seccion 


19. Utilizando sus calculos del ejercicio 9, calcule e interprete el error estandar de estimacion para State University. 
Haga una grafica en la interpretation. ^Como puede utilizarse como medida de bondad de ajuste? 

20. Con base en los datos del ejercicio 10, ^cual es el error estandar de estimacion para el Departamento de 
Recursos Humanos de Florida State? ^Como interpretana los resultados? Utilice una grafica. 

21. Calcule e interprete el error estandar de estimacion para el ejercicio 1 1 sobre el banco de Atlanta. 

22. The Overland Group, del ejercicio 12, ahora desea conocer el error estandar de estimacion. 

23. ^Cual es el error estandar de estimacion que va a experimentar el profesor del ejercicio 13? 


11.7 Analisis de correlation 

El modelo de regresion ha proporcionado un panorama claro de la relacion entre los gastos publicitarios de 
Hop Scotch Airlines y el numero de valientes viajeros que hacen fila en el puesto expendedor de pasajes. El 
valor positivo para b } indica una relacion directa. A medida que la publicidad aumenta, tambien lo hace el 
numero de pasajeros. Ahora es util obtener una medida de la fuerza de esa relacion. Esta es la funcion del 
coeficiente de correlacion, desarrollado por Carl Pearson a finales de siglo, y algunas veces se le llama el 
coeficiente de correlacion producto-momento de Pearson. Representado con una r, el coeficiente de correlacion 
puede asumir cualquier valor entre -1 y + 1; es decir, 


-1 < r < + 1 

Un valor de r = -1 indica una relacion negativa perfecta entre Xy Y, tal como se observa en la figura 11.13a). 
Todas las observaciones quedan en una lmea recta perfecta con una pendiente negativa. Por tanto, X y 7 se 
moveran en direcciones opuestas. La figura 11.13b) muestra una relacion positiva perfecta entre Xy Y con r = + 


Figura 11.13 

Posibles valores 
para el coeficiente 
de correlacion r 






(Continua) 
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Poca o ninguna relacion; no se X 
puede dibujar una recta que ajuste 


1. Como se anoto anteriormente, en toda relacion entre dos variables existe la posibilidad de que exista alguna 
variation alrededor de la recta de regresion. Esto se observa en las figuras 1 1 . 1 3 c) y 1 1 . 1 3 d), las cuales muestran 
relaciones fuertes pero menos perfectas. En ambos casos el valor absoluto de r se aproxima a 1. Por el contrario, 
la figura 1 1 . 1 3 e) muestra muy poca o ninguna relacion entre X y Y, y r se aproxima a cero. En general, entre mayor 
sea el valor absoluto de r, mas fuerte sera la relacion entre X y Y. 

Para comprender plenamente lo que mide el coeficiente de correlation, se deben desarrollar tres medidas de 
desviacion. La desviacion total de Y es la cantidad por la cual los valores individuates de Y, ( Y ) varfan de su media 
Y,(Y.-Y). Utilizando como ejemplo el mes 1 3 de los datos sobre Hop Scotch de la tabla 1 1 .2, la figura 11.14 muestra 
la desviacidntotal como (23 - 17.87) = 5. 1 3. El valor de Y de 23 queda 5.13 por encima de la recta horizontal que 
representa a y de 17.87. Si todas la n = 15 desviaciones totales se calculan y se elevan al cuadrado, y los resultados 
se suman, entonces se tendra la suma de cuadrados de las desviaciones totales , SCT. 

Figura 11.14 

Desviaciones para 
Hop Scotch Airlines 



Suma de cuadrados total 


sct = 2(r,. - y) 2 


[11.19] 


Esta desviacion total, como se observa en la figura 1 1 . 14, puede dividirse en desviacion explicada y desviacion no 
explicada. La desviacion explicada es la diferencia entre lo que predice el modelo de regresion Yj , y el valor 
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promedio de Y , (¥} - Y ). Es esa portion de la desviacion total la que es explicada por el modelo de regresion. En X 
= 16,F/=4.4 + 1.08 (16) = 21.68. La figura 1 1.14 muestraque la desviacion explicada es (21.68 - 17.87) = 3.81. Siesta 
portion de la desviacion total, la cual es explicada por el modelo de regresion, se calcula para todas las n = 15 
observaciones y luego se eleva al cuadrado, y los resultados se suman, entonces se tendra la suma de cuadrados 
de la regresion , SCR, 


Suma de cuadrados 
de la regresion 


SCR = 2(f ; ~ Y) 2 


[ 11 . 20 ] 


La desviacion no explicada que se observa en la figura 1 1 .14 es esa portion de la desviacion total que no es 
explicada por el modelo de regresion. Es decir, es el error (Y. - Yj). La figura 11.14 muestra que es (23 - 2 1 .68) = 1 .32. 
Si se calculan estos terminos de error para todos los n = 15 observaciones y luego se eleva al cuadrado y luego los 
resultados se suman, se tendra la suma del cuadrado del error, SCE. 


Suma del cuadrado 
del error 

SCE = 2(K, - Y,) 2 

[11.21] 

El coeficiente de correlation se calcula asi: 

Coeficiente 

de correlacion r = 1 



j Variation explicada jSCR 

V Variation total ~ ySCT 

[11.22] 


Se observa precisamente lo que r esta midiendo. Esta comparando el monto total de la desviacion alrededor de Y , 
SCT, con la portion de esta que esta explicada por el modelo de regresion SCR. Como rafz cuadrada de SCR/SCT \ 
el coeficiente de correlacion proporciona una medida relativa de la capacidad del modelo para explicar las 
desviaciones en los valores Y,. Por ende mide la fuerza de la relation entre Y y la variable explicativa X. 

La formula (1 1 .22) es dificil de calcular manualmente. Una formula mas conveniente es 


Forma de calcular _ Sexy 

el coeficiente de correlacion ’ V(scx)(scy) 


[ 11 . 23 ] 


En el caso de Hop Scotch, se tiene que 


148.93333 

V(137.7333)(171.7333) 


= 0.9683 


Esto indica una relation positiva fuerte entre los pasajeros y la cantidad de dinero invertido en fines publicitarios. 

Vale la pena reeordar que el error estandar de estimation Se , que se calculo anteriormente, es una medida de la 
bondad de ajuste. Proporciona una medida cuantificable de que tan bien se ajusta el modelo a los datos que se han 
recolectado. 
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El coeficiente de determinacion r 2 es otra medida quiza mas importante de la bondad de ajuste. Se halla 


Coeficiente de 
determinacion: una medida 
de bondad de ajuste 



2 j desviacion explieada jsCR 

V desviacion total ySCT 

[11.24] 

Una formula mas conveniente de calculo es 



Formula computacional para 

, {SCxyf 

r L = , 

[11.25] 

el coeficiente de determinacion 

VCsot)(sc>) 


Proporciona una medida de bondad de ajuste porque revela que porcentaje del cambio en Y se explica por un 
cambio en X. 

El coeficiente de determinacion para Hop Scotch es: 

r 2 = (SCry) 2 
r (SCx)(SCy) 

= (148.9333) 2 

(137.7333X171.7333) 

= 0.93776 o 0.94 

Como se puede esperar, r 2 puede determinarse mds facil, simplemente elevando al cuadrado el coeficiente de 
correlacion r. 


r 2 = (0.9683) 2 = 0.94 

Esto establece que el 94% del cambio en el numero de pasajeros se explica mediante un cambio en la publicidad. 
La pantalla de Minitab 1 1.4, presentada anteriormente, muestra que ^es 93.8%. 

Este r 2 tiene significado solo para las relaciones lineales. Dos variables pueden tener un r 2 de cero y sin 
embargo estar relacionadas en sentido curvilmeo. Ademds, no se interpreta este valor como si el 94% del cambio 
en los pasajeros fuera causado por un cambio en la publicidad. La correlacidn no significa causa. Este asunto se 
enfatiza en la siguiente seccion. 


Ejercicios de la seccion 


24. ^Cdmo puede utilizarse el coeficiente de determinacion como medida de bondad de ajuste? Realice la grdfica 
para ilustrar. 

25. ^Cu£l es la fuerza de la relacidn entre GPA y las ofertas de trabajo en el ejercicio 9? 

26. Calcule e interprete el coeficiente de correlacion y el coeficiente de determinacion para el Departamento de 
Recursos Humanos de Florida State en el ejercicio 10. 

27. ^Cuantos cambios en las casas vendidas pueden explicarse por la tasa de interes del ejercicio 11? 

28. <,Cu£l es la fuerza del modelo del profesor Mundane utilizado en el ejercicio 13 para explicar las ausencias de 
los estudiantes? 
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11.8 Limitaciones del analisis de regresion 

Aunque los analisis de regresion y correlacion con frecuencia han demostrado ser de utilidad en la toma de 
decisiones para una gran variedad de negocios y de asuntos economicos, existen ciertas limitaciones en su 
aplicacion e interpretacion. Estos no pueden determinar relaciones causa-efecto. La correlacion no implica 
causalidad. Este punto fue elaborado dramaticamente por un estadistico britanico quien “probo” que las cigiienas 
traian a los bebes. El recolecto datos sobre las tasas de natalidad y el numero de cigiienas en Londres y descubrio 
una correlacion muy alta - algo asi como r = 0.92. Por tanto, el concluyo que la historia sobre las cigiienas y los 
bebes era cierta. 

Sin embargo, como ya se habra sospechado, esta no es la forma como funciona la correlacion. Parece que a 
esta especie de cigiienas les gusta anidar en la parte superior de la chimenea de los londinenses. Por tanto, 
cuando la poblacion era densa y la tasa de natalidad era alta, habian muchas chimeneas para atraer a estas aves, 
de alii la alta correlacion entre la tasa de natalidad y las cigiienas. En realidad, tanto las cigiienas como los 
nacimientos eran causados por un tercer factor, la densidad poblacional, que el investigador ignoro a su 
conveniencia. Vale la pena recordar que la correlacidn no significa causalidad. 

Adicionalmente, se debe tener cuidado de no utilizar el modelo de regresion para predecir Y para valores de X 
que esten fuera del rango del conjunto original de datos. Los valores para X en el conjunto de datos de Hop 
Scotch oscilan desde tan bajo como 8 hasta tan alto como 19. Se ha aislado la relacion entre X y Y solo para ese 
rango de valores X. No se sabe cual es la relacion fuera de ese rango. Todo lo que se sabe es que puede aparecer 
como en la figura 11.15. Como se puede observar, para los valores fuera del rango de 8 a 1 9, la relacion X - Y es 
totalmente diferente de lo que se puede esperar dado el ejemplo. 


Figura 11.15 

Una posible 
relacion X -Y 



Otra falla del analisis de correlacion y de regresion se hace evidente cuando dos variables no relacionadas 
parecen presentar alguna relacion. Se asume que se desea analizar la correlacidn entre el numero de elefantes 
nacidos en el zoologico de Kansas City y las toneladas de trucha que recogen los Pescadores del Golfo de 
Tallahassee, Florida. Se halla r = 0.91. ^Se concluird que existe una relacidn? Tal conclusidn es obviamente 
disparatada. A pesar del valor r, la simple ldgica indica que no hay relacidn entre estas dos variables. No se ha 
abarcado la correlacion espurea, que es la correlacidn que ocurre simplemente por suerte. No hay sustituto para 
el sentido comun en el andlisis de correlacion ni en el de regresidn. 


11.9 Pruebas para los parametros poblacionales 

Los resultados estadfsticos sugieren una relacion entre los pasajeros y la publicidad de Hop Scotch Airlines. Los 
valores que no son cero para el coeficiente de regresidn (pendiente) de b i = 1 .08 y el coeficiente de coirelacidn de 
r = 0.968 indican que, a medida que los gastos publicitarios cambian, cambia el numero de pasajeros. 

Sin embargo, estos resultados se basan en una muestra de solo n = 15 observaciones. Como siempre se 
pregunta si ^existe alguna relacion a nivel poblacional? Podria ser que debido al error de muestreo los parametros 
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poblacionales son cero y se deben probar los parametros poblacionales para asegurar que el hallado estadfstico 
difiere significativamente de cero. 


A. Pruebas para 

Si la pendiente de la recta de regresion poblacional real pero desconocida es cero, no existe relacion entre los 

pasajeros y la publicidad contraria a los resultados muestrales. Si se hace un diagrama de dispersion para la 

poblacion de todos los puntos de datos X , Y , puede aparecer como la figura 1 1 . 1 6. La ausencia de cualquier patron 

indica que no existe relacion. A1 recolectar la muestra, se puede haber incluido solo 15 de tales observaciones 

dentro de la elipse. Tornados por si solos, e«tn« Hntnc xnmpren de manera falsa una relacion positiva. Se debe 

probar la hipotesis: _ 

H () : pj — u 

HaP 


Figura 11.16 

Un diagrama 
de dispersion para 
la poblacion 
de todos los puntos 
X-/ 



Esta prueba emplea el estadfstico t 


La prueba f para el eoefieiente _ b { - j8, 

de regresion poblacional ~~ s hi 


[11.26] 


y tiene n -2 grados de libertad, en donde s bl es el error estandar de la distribucion muestral de b r Reconoce que 
muestras diferentes dan valores diferentes para b { . Por tanto, si (3, es realmente cero, estos valores para b { se 
distribuirfan alrededor de cero como se muestra en la figura 1 1.17. Se puede calcular s b mediante 


Error estandar del 
eoefieiente de regresion 



[11.27] 


Dados los valores para Hop Scotch, 


y 


0.907 

Sh ' ~ V137.73333 


= 0.07726 


1.0813 - 0 


13.995 


t 


0.07726 
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Si se selecciona un valor a del 5%, 1 005 13 = ± 2. 160. La regia de decision es: 

Regia de decision: “No rechazar si t esta entre ± 2. 1 60, de lo contrario rechazar”. 


Figura 11.17 

Distribution de b. 

si A = 0 



Debido a que t = 13.995, la hipotesis nula de que /3 ; = 0 se rechaza. A1 nivel del 5% parece existir una relation 
entre pasajeros y publicidad. Esto puede confirmarse mediante la pantalla de Minitab 11.4 (que se mostro 
anteriormente). El valor p de 0.000 tambien aparece en la pantalla. 

Si la hipotesis nula no hubiera sido rechazada, se concluiria que la publicidad y los pasajeros no estan 
relacionados. Descartando el modelo, se utilizarfa una variable explicativa diferente. 

Debido a que se ha rechazado la hipotesis nula de que /3 ; = 0, la pregunta natural es, “^Cual es su valor?” Esta 
pregunta puede responderse calculando un intervalo de confianza (I.C.) para j. 3 r 


I.C. para /3, = 6, ± t(s h ) [ 11 . 28 ] 

Si se utiliza un nivel de confianza del 95%, 

I.C. para = 1.08 ± (2.160)(0.07726) 

0.913 ssft < 1.247 

Esto significa que se puede estar 95% seguro de que el coeficiente de regresion para toda la poblacion de todos 
los valores X, Y esta entre 0.913 y 1 .247. 


B. Pruebas para el coeficiente de correlacion poblacional p 

Gran parte del trabajo realizado para probar las inferencias sobre el coeficiente de regresion puede aplicarse al 
coeficiente de correlacion. El proposito y los fundamentos son muy similares. Como el andlisis respecto a la 
correlacion entre pasajeros y publicidad se basa en los datos muestrales, el error de muestreo podrfa llevamos a 
conclusiones no apropiadas. Es decir, los datos muestrales produjeron un coeficiente de correlacion de no cero de 
r = 0.9683 debido al error de muestreo como el de la figura 11.16. Puede ser que la correlacion a nivel poblacional 
sea cero y que una muestra enganosa hizo que se asumiera equivocadamente una relation. Por consiguiente se 
debe probar la hipotesis 


H- p = 0 
H a : p # 0 
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en donde p es el coeficiente de correlation a nivel poblacional. De nuevo, se utiliza la prueba t 


Una prueba t para el coeficiente t 

de correlacion poblacional 

r — p 

= . [11.29] 

A 

en donde s r es el error estandar del coeficiente de correlacion y puede hallarse asi 

El error estandar 

del coeficiente de correlacion s ' ~ \j 

1,1 '' 2 [11.30] 

n 2 


Entonces, 


y 


1 - 0.93776 
15-2 


0.069 


0.9683 - 0 
0.069 


13.995 


Si aes 5%, 

La regia de decision es: “No rechazar si t esta entre ± 2.160. De otro modo rechazar”. 

Debido a que t = 14.033 > 2.160, se rechaza la hipotesis nula. A un nivel de significancia del 5%, se concluye que 
el coeficiente de correlation poblacional no es cero y que los pasajeros y la publicidad estan relacionados. A1 
igual que con la prueba para /3 ; , si la hipotesis nula no se rechaza se concluye que la publicidad no tiene poder 
explicativo y el nuevo modelo tendra que especificarse. 

El hecho que el valor t de 14.033 sea casi el mismo tanto para /J, como para p no es coincidencia. Siempre se 
obtendran los resultados identicos de estas dos pruebas de hipotesis en un modelo de regresion simple y, en 
realidad, posiblemente no se realizaran pruebas de hipotesis tanto para como para p. Sin embargo, deberfan 
acostumbrarse a ambas pruebas puesto que esta igualdad no se mantiene en un modelo de regresion multiple, 
como se vera en el siguiente capitulo. 


Ejercicios de la seccion 


29 . Utilizando la prueba de hipotesis apropiada, al nivel del 5%, £es GPA una variable explicativa significativa de 
las ofertas de trabajo en el ejercicio 9? Asegurese de mostrar los cuatro pasos. 

30 . En el ejercicio 10, ^la relation entre la tasa de interes y las ventas de vivienda es significativa? Pruebe la 
hipotesis a un nivel de significancia del 1%. 

31 . En el ejercicio 1 1 , ^la tasa de interes es significante al nivel del 10%? Pruebe la significancia del coeficiente de 
correlation al 10%. ^Como difiere esta prueba de la prueba para /? ; ? 

32 . Pruebe la hipotesis del profesor Mundane para al nivel del 5% en el ejercicio 13. ^Que concluye? Comparela 
con su prueba para p. 







CAPITULO 11 • Regresion simple y correlation 353 


33. Pruebe la significancia de los puntajes del examen en el ejercicio 14 al nivel del 5%. <?,Cual es el valor p para 
esta prueba? 


11.10 Intervalos de confianza en el analisis de regresion 

El analisis de regresion puede pronosticar y predecir valores para la variable dependiente. Una vez que se ha 
determinado la ecuacion de regresion, se puede desarrollar un estimado puntual para la variable dependiente 
sustituyendo un valor dado para X en la ecuacion y despejando Y. 

Ademas, el investigador puede estar interesado en los estimados por intervalo . Ya hemos visto que con 
frecuencia se prefieren mas que los estimados puntuales. Existen por lo menos dos estimados por intervalo que se 
relacionan comunmente con los procedimientos de regresion. 

El primero es un estimado por intervalo para el valor promedio de Y dado cualquier valor X. Se puede estimar 
la media poblacional para todos los valores de Y (no solo los n = 15 de la muestra) cuando X es igual a algun valor 
dado. Se puede desear el numero promedio de pasajeros en todos los meses en los que se gasto US$10,000 en 
publicidad (por ejemplo, X= 10). Esto es lo que se denomina media condicionada. 

Un segundo intervalo de confianza importante busca estimar un valor unico de Y dado que X se fija en una 
cantidad especifica. Este estimado se llama intervalo de prediccion (I.P.). Por tanto, mientras que la media 
condicionada es una estimacion del valor promedio de Y en todos los meses en los cuales X es igual a un monto 
especificado, los estimados por intervalo de prediccion Y en cualquier mes, en el cual X se fija en un monto dado. 


A. La media de Y condicionada a un valor de X 

Se supone que se desea desarrollar un estimado por intervalo para la media condicionada de Y, p y \ x . Esta es la 
media poblacional para todos los valores de Y y con la condicion de que X sea igual a un valor especifico. Vale la 
pena recordar que si X es igual a algun monto dado (por ejemplo X — 10) muchas veces, se obtendran muchos 
valores diferentes de Y. El intervalo que se esta calculando aquf es un estimado de la media de todos los valores 
de Y. Es decir, es una estimacion de intervalo para el valor promedio de Y y con la condicion que X se deje igual 10 
veces. 

En realidad el intervalo de confianza para el valor promedio condicional de Y tiene dos posibles interpretaciones, 
de la misma manera que los intervalos de confianza que se realizaron en el capftulo 7. Se asume que se esta 
calculando, por ejemplo, un intervalo de confianza del 95%. 

Primera interpretation: Como se explico anteriormente, si se deja X igual la misma cantidad de veces, se 
obtendran muchos valores diferentes de Y. Entonces se puede estar 95% seguro de que la media de esos valores 
Y(p y ^) caera dentro del intervalo especificado. 

Segunda interpretation: Si se tomaran muchas muestras de los valores de X y F, y se construyera un 
intervalo de confianza con base en cada muestra, 95% de ellos contendria Y p y [jc , el valor promedio real pero 
desconocido de Y dado que X = 10. 

Para calcular este intervalo para el valor promedio condicional de F, se debe primero determinar S y , el error 
estandar de la media condicionada. El error estandar de la media condicionada reconoce que se utiliza una muestra 
para calcular b Q y b x en la ecuacion de regresion. Por tanto, b {] y b { estan sujetos al error de muestreo. Si se fuera 
a tomar un conjunto diferente de n = 15 meses y determinar una ecuacion de regresion, serfa probable que se 
obtuvieran valores diferentes para b Q y b { El proposito de S y es tener en cuenta los diferentes valores de b 0 y b { 
que resultan del error de muestreo. Se determina mediante: 
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Error estandar de la s - Se 

media condicionada Y e \ 

[11.31] 

n SCx 

en donde Se = es el error estandar de estimacion 

X. = es el valor dado para la variable independiente 

El intervalo de confianza para la media condicionada es entonces: 

Intervalo de confianza para IC 

la media condicionada 

P^a fi y \ x = ± tS Y [11.32] 


en la cual Y; es el estimador puntual hallado de la ecuacion de regresion. El valor t se basa en n - 2 grados de 
libertad porque se deben calcular los dos valores b Q y b x de los datos muestrales. 

Si Hop Scotch desea desarrollar el intervalo para la media condicionada en donde X. = 10 y la media de todos 
los 15 valores de XesX= 12.47, la formula (1 1.31) da: 


= 0.907 



+ 


(10 - 12.47) 2 
137.73333 


= 0.303 


Si se utiliza un nivel de confianza del 95%, t 05 13 = ± 2. 1 60. Ya que: 

Y i = 4.4 + 1.08(10) - 15.2 


La formula (11 .32) halla 

I.C.para fjL yU - 15.2 ± 2.160(0.303) 

14.55 < ix yU < 15.85 

Hop Scotch puede estar 95% seguro de que si se invierten US$10,000 en publicidad muchas veces (teoricamente, 
un numero infinito de veces), existe un 95% de probabilidad de que la media de todos los valores resultantes para 
los pasajeros estara entre 14,550 y 15,850. Minitab tambien genera este intervalo, como se observa en la pantalla 
11.4 (que se presento anteriormente). 


Figura 11.18 
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Se calcularfa el intervalo de confianza para jU y , v en valores diferentes de X. Estos intervalos conformaran toda 
una banda de confianza para fi y ^ Vale la pena notar que en la figura 1 1 . 1 8 , la banda se vuel ve mas ancha en cada 
extremo porque el analisis de regresion se basa en las medias, y entre mas se aleja de la media de X = 12.47, los 
resultados se vuelven menos precisos. Por tanto, para mantener el nivel de confianza del 95%, la banda debe ser 
mas amplia. 


B. El intervalo de prediccion para un valor unico de Y 

El intervalo de confianza elaborado anteriormente es para el valor de la media poblacional de todos los valores de 
Y cuando X es igual a una cantidad dada muchas veces. En otras ocasiones puede ser util construir un intervalo 
de confianza para un valor unico de Y que se obtiene cuando X se deja igual a un valor dado una sola vez. Hop 
Scotch puede estar interesado en predecir el niimero de clientes el proximo mes si invierte US$ 10,000 en publicidad. 
Esto difiere del problema anterior en el cual la preocupacion se centraba en el valor promedio de Y si X se fija en 
10 muchas veces. 

Ahora el objeto es predecir un valor unico de Y si X se fija en una cantidad dada una sola vez. En lugar de 
intentar predecir la media de muchos valores Y , obtenidos con la condition de que X sea igual a 10 muchas veces, 
se desea predecir un valor unico para Y, obtenido si X se fija en 10 una sola vez. Detengase a pensar en este 
problema durante un minuto. Los promedios tienden a estar centrados alrededor de la mitad del conjunto de 
datos. Por tanto, son mas faciles de predecir debido a que se conoce en donde estan. Sin embargo, los valores 
individuales estan muy dispersos y por tanto son mas dificiles de predecir. Por ende, un intervalo de confianza del 
95% para un valor unico de Y debe ser mas ancho que el de una media condicionada. 

Este intervalo de confianza para el intervalo de prediccion de Y tambien tiene dos interpretaciones. Tales 
interpretaciones se proporcionan bajo el supuesto de que los intervalos que se calcularon son intervalos del 95%, 
aunque, por supuesto, pueden utilizarse otros niveles de confianza. 

Primera interpretacion: Si se determina que X es igual a alguna cantidad solo una vez, se podria obtener un 
unico valor resultan te de Y. Se puede estar 95 % seguro de que dicho valor unico de Y cae dentro del intervalo 
especificado. 

Segunda interpretacion: Si se tomaran muchas muestras y cada una se utilizara para construir un intervalo 
de confianza de prediccion, el 95% de ellos contendrian el valor verdadero para Y. 

Para calcular este intervalo de prediccion, primero se debe calcular el error estandar del pronostico, S yi (no 
confundirse con el error estandar de la media condicionada S y ). Este error estandar del pronostico explica el hecho 
de que los valores individuales esten mas dispersos que las medias. El error estandar del pronostico S y ., refleja el 
error de muestreo inherente al error estandar de la media condicionada 5, mas la dispersion adicional, porque se 
esta tratando con un valor individual de Y. La formula (1 1.33) se utiliza en su calculo: 


Error estandar 

del pronostico s * = Se ]j 

fl + 1 + (Xi X)2 [11.33] 

n SCx 

El intervalo de prediccion para un valor unico de Y, Y entonces sera: 

Intervalo de confianza para 
el intervalo de prediccion 

I.C. para Y x = Y, ± tS r [11.34] 
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Ahora se construye un intervalo de confianza para un valor unico de Y cuando X = 10 y se compara con el 
intervalo para la media condicionada elaborado anteriormente. 


_ Sey ji + ± + 

= 0.907 VI. 1114 


(10 - 12.47) 2 
137.73333 


= 0.956 


Debido a que: y. = 4.4 + 1.08(10) 

= 15.2 

Se obtiene: 

I.C.para Y x = Y t ± tS y> 

= 15.2 ± (2.160)(0.956) 

- 15.2 ± 2.065 
13.14 < Y x < 1121 

De nuevo la pantalla en Minitab 1 1 .4 confirma este intervalo. Hop Scotch puede estar 95% seguro de que si en 
un mes cualquieraX = US$10,000, el valor unico resultante de Festara entre 13,140 y 17,270 pasajeros. 

Como se prometio, este intervalo es mas amplio que el primero porque se esta trabajando con menos valores 
individuales predecibles. Se comparan en la figura 11.19. 

Figura 11.19 

Estimados por intervalo 



Estas bandas de confianza se observan en la pantalla de Minitab 11.5, aunque las curvaturas no son tan 
evidentes. 
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Pantalla en Minitab 11.5. 

Confidence bands for fi ylx and Y x (Bandas de confianza para li y \ x Y Y x ) 


Trazado de la regresion 



Y = 4.38625+ 1 .081 32* 
/f-squared = 0.938 

Regresidn 

95% I.C. 

95% I.P. 

I.C. = Intervalo 
I.P. = Intervalo 


de 

de 


confianza 

prediccion 


C. Factores que influyen en el ancho del intervalo 

Dado un nivel de confianza, es preferible minimizar la amplitud del intervalo. Entre mas pequeno sea el intervalo, 
mas precisa sera la prediccion de fi y y o de 7 . Sin embargo, existen fuerzas que trabajan en contra del intento de 
producir un intervalo mas estrecho. 

La primera es el grado de dispersion de los datos originales. Entre mas dispersos estdn los datos originales, 
mayor ser£ el Se, el error estandar de estimation. Dada la aritmetica de las formulas (1 1 .31) y (1 1 .33), un Se mayor 
resulta en un intervalo mas amplio. 

El tamano de la muestra es un segundo factor en la determinacidn de la amplitud del intervalo. Como se ha 
observado en los capitulos anteriores, un tamano muestral grande termina en un error estandar mas pequeno. De 
nuevo, dada la aritmetica descrita anteriormente, un error estandar pequeno resulta en un intervalo pequeno. 

Adem&s, como ya se ha visto, un valor de X relativamente cercano a X producir^ un intervalo pequeno porque 
la regresion se basa en los promedios. Por tanto, un tercer factor que influye en la amplitud del intervalo es la 
distancia a la cual esta un valor particular de X de X. 


Ejercicios de la seccion 


34. iQu6 miden el error estandar de la media condicionada y el error estdndar del prondstico? 

35. <-,En que difiere el intervalo de confianza para la media condicionada del intervalo de prediccidn? 

36. ^Qud miden las bandas de confianza para la media condicionada y el intervalo de prediccidn y por qud tienen 
la forma que tienen? ^Qud afecta la amplitud de estos intervalos? 

37. El centro de ubicacidn laboral en State University, del ejercicio 9, desea un estimado por intervalo del 95% 
para el numero promedio de ofertas laborales que muchos de sus graduados recibiran para quienes obtuvieron 
un GPA de 2.69. Calcule e interprete el intervalo apropiado. 

38. Fred tiene un GPA de 2.69 (ver ejercicios 9 y 37). Calcule el intervalo del 95% para el numero de ofertas 
laborales que recibira. ^Por que difiere de su respuesta del ejercicio 37? 
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39. Si el economista del Departamento de Recursos Humanos de Florida State, del ejercicio 1 0, identifica muchos 
consumidores con ingresos de US$14,200, <,cudl es el intervalo del 99% para el consumo promedio de todos 
esos consumidores? 

40. Si el economista del ejercicio 39 identifica un consumidor con un ingreso de US$ 14,500 

a. ^Cual es la estimacion puntual de su consumo? 

b . ^Cual es el estimado por intervalo del 99% de su consumo? 


11.11 Analisis de varianza en la regresion 

El modelo de regresion presenta una descripcion de la naturaleza de la relation entre las variables dependiente e 
independiente. Se utilizo una prueba t para probar la hipotesis que ^ = 0. Una prueba similar puede realizarse con 
el uso del analisis de varianza (ANOVA) con base en la prueba F. El procedimiento ANOVA mide la cantidad de 
variacion en el modelo de muestreo. Como se anoto anteriormente, existen tres fuentes de variacion en un modelo 
de regresion: la variacion explicada por la regresion (SCR), la variacion que permanece sin explicar debido al error 
(SCE), y la variacion total ( SCT ), la cual es la suma de las dos primeras. Esto puede resumirse en una tabla de 
ANOVA, cuya forma general se presenta en la tabla 11.3. 


Tabla 11.3 

Fuente de variacion 

Suma 

Grados 

Cuadrado 

Razon F 

Tabla general 


de cuadrados 

de libertad 

medio 


Regresion 

SCR 

k 

CME = 

K 

CMR 

CME 

de ANOVA 


Error 

SCE 

n-k- 1 

CME = 5CE 
n-k - 1 



Total 

SCT 

n - 1 




La razon CMRICME proporciona una medida de exactitud del modelo porque es la razon de la desviacidn 
promedio al cuadrado que se explica con el modelo, y la desviacion promedio al cuadrado se queda sin explicar. 
Entre mayor sea esta razon, el modelo tendra mayor poder explicativo. Es decir, una prueba F alta senala que el 
modelo posee un poder explicativo significativo. Para determinar que es alto, el valor F debe compararse con un 
valor crftico tornado de la tabla G del apendice III. 

La formula computacional para SCE se dio en la formula (11.16). SCR puede calcularse como: 


Suma de cuadrados scr= ( SCxy ^ 

de la regresion sex 


[11.35] 


Utilizando los datos de Hop Scotch, la formula 1 1. 16 da: 

(SCxy ) 2 


SCR = SCy 


SC x 


= 171.73333 
= 10.69 


(148.93333) 2 

137.73333 


y la formula 1 1.35 produce: 
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= (148.93333) 2 
137.73333 
= 161.0441 


SCT se halla como la suma de SCR y SCT, como se muestra en la tabla 1 1 .4 . El valor F tiene 1 y 1 3 grados de libertad 
debido a que fue formado con el cuadrado medio de la regresion y el cuadrado medio del error, tal como se observa 
en la tabla 1 1 .4. La pantalla en Minitab 1 1 .4 tambien proporciona la tabla ANOVA. 


Tabla 11.4 

Tabla ANOVA 

Fuente de variation 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Razon F 

para Hop Scotch 

Regresion 

161.04 

1 

161.04 

196.39 

Airlines 

Error 

10.69 

13 

0.82 



Total 

171.73 

14 




Se puede fijar a = 0.05 para contrastar la hipotesis de que /3 l = 0. Entonces F 005 { 13 = 4.67 produce una regia de 
decision que establece que se deberia rechazar la hipotesis nula si el valor F excede de 4.67. Como 196.39 >4.67, 
se rechaza la hipotesis nula y se concluye con un 95% de confianza en que la publicidad tiene poder explicativo. 
Este es el mismo resultado obtenido en la prueba t. 

En realidad, en regresion simple, la prueba F y la prueba t son analogas. Ambas daran los mismos resultados. 
El valor F es el cuadrado del valor t. En regresion multiple, la prueba F produce una prueba mas general para 
determinar si alguna de las variables independientes en el modelo tienen poder explicativo. Cada variable se 
prueba despues por separado con la prueba t para determinar si es una de las variables significativas. 


Problemas resueltos 

1. Funcion de consumo de Keynes En el aho de 1936, en su famoso libro, The General Theory of Employment, 
Interest and Money (Teona general del empleo, interes y dinero), el notable economista britanico John 
Maynard Keynes propuso una relacion teorica entre el ingreso y los gastos en consumo personal. Keynes 
argumento que a medida que el ingreso aumentaba, el consumo se incrementarfa en una cantidad menor. Esta 
relacion teorica se ha probado empiricamente muchas veces desde 1936. 

Milton Friedman, profesor de economia en la Universidad de Chicago y premio Nobel de economia, recolecto 
datos sobre el ingreso y el consumo en los Estados Unidos durante un perfodo prolongado. Aqui se muestran 
las 10 observaciones sobre los niveles anuales de consumo e ingreso utilizados por Friedman en su estudio. 
Utilizando estos datos, se deriva una funcion de consumo bajo el supuesto de que existe una relacion lineal 
entre el consumo y el ingreso. Las cifras se encuentran en miles de millones de dolares corrientes: 


Ano 

Ingreso 

Consumo 

1950 

284.8 

191.0 

1951 

328.4 

206.3 

1952 

345.5 

216.7 

1953 

364.6 

230.0 

1954 

364.8 

236.5 

1955 

398.0 

254.4 

1956 

419.2 

266.7 

1957 

441.1 

281.4 

1958 

447.3 

290.1 

1959 

483.7 

311.2 
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a . Debido a que el consumo depende del ingreso, el consumo es Y o variable dependiente. Friedman busco 
una funcion de consumo de la forma 

C == t>Q + b]I 


en donde C es el consumo e / es el ingreso. 

2X = 3,877.4 2XY = 984,615.32 X.Y 2 = 630,869.49 
27 = 2,484.3 UC 2 = 1,537,084.88 

SCx . lx ,-m 


= 1,537,084.88 - 
= 33,661.804 


(3,877,4) 2 

10 


SCy = 27 2 - 


(27) 2 


- 630,869.49 


(2,484.3) 2 


10 


- 13,694.841 

csn 


= ixy 


984,615.32 


21,352.838 


(3,877.4)(2,484.3) 

10 


> SCx>> 
’ SCx 


= 21,352.838 
33,661.804 

= 0.634 
b 0 = ¥ — b { X 

= 248.43 ~ (0.634)(387.74) 
= 2.603 


Por tanto: 


C = 2.603 + 0.63/ 


Estos no son los mismos valores que Friedman encontro debido a que se utilizo solo una pequena porcion de 
su conjunto de datos. Sin embargo, el modelo confirma la teorfa de Keynes. El coeficiente de 0.63 demuestra 
que por cada US$1 (o US$1,000,000,000) de incremento en el ingreso, el consumo se incrementara en 63 
centavos de dolar (o US$630,000,000). Quienes han tornado un curso de introduecion a la macroeconomfa 
reconoceran que 0.63 es la propension marginal al consumo. La constante, o termino intercepto, de 2.603 es 
el nivel de consumo cuando el ingreso es cero. Los economistas con frecuencia argumentan que esta 
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interpretation del termino intercepto no es valida debido a que un si sterna economico siempre generara 
ingreso positivo. La funcion de consumo, por tanto, se grafica sin el intercepto, como en la figura. Si /= 345.5, 
como en 1952, el modelo predice 

C = 2.603 4 - 0.63(345.5) = 220.26 

El consumo en realidad fue de 216.7 en 1952, resultando un error de US$3,560,000,000 


C = 2.603 + 0.63(345.5) - 220.26 



b. El coeficiente de determination es: 

(SCxy ) 2 

r (SCx)(SCy) 

= (21.352.838) 2 

(33,661.804)(13, 694.841) 

= 0.989 

Un cambio en el ingreso explica mas del 98% de la variation en el consumo. La information respecto a los 
valores b Q . , b { y r 2 son vitales para quienes aconsejan al Congreso y al presidente sobre asuntos de politica 
economica nacional. 

2. Acciones de la Reserva Federal para frenar la inflation Despues de aproximadamente seis anos de expansion 
continuada, la economia de los Estados Unidos comenzo a presentar signos de presiones inflacionarias en 
otono de 1988. Un articulo de la edition de septiembre de The Wall Street Journal describio los esfuerzos de 
la junta de la Reserva Federal por calmar estos aires inflacionistas. Esto debia realizarse restringiendo el 
suministro de dinero a traves del incremento en la tasa de descuentos que los bancos comerciales deben 
pagar por prestar de la Reserva Federal. En febrero de 1988, Manuel H. Johnson, vicepresidente de la Reserva 
Federal, dijo ante una audiencia de una conferencia de Cato Institute, que las acciones de la Reserva respecto 
a la tasa de descuentos podrfan predecirse sobre la base de la tasa de los fondos federates, la cual es el costo 
que los bancos cobran entre ellos para los creditos de un dia para otro. Sin embargo, durante lo que resto de 
1988, los controladores de la Reserva argumentaron que la tasa de los fondos federates no estaba sirviendo 
como predictor adecuado de los cambios en la tasa de descuento, y que este comportamiento deficiente 
dificultaba que los inversionistas intentaran predecir que nivel de la tasa de interes permitirfa la Reserva 
Federal. 

Aqui se presentan los valores para la tasa de los fondos federates y la tasa de descuento desde mediados de 
1987 hasta mediados de 1988. ^Estos datos sustentan los cargos de los controladores de la Reserva Federal? 
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Fecha 

Tasa de Fondos 
Federales (°/o) 

Tasa de 
descuento (%) 

Fecha 

Tasa de fondos 
Federales (%) 

Tasa 

descuento (°/o) 

Junio de 1987 

8.0 

7.5 

Die. de 1987 

7.0 

5.5 

Jul.de 1987 

7.5 

7.5 

Ene. de 1987 

6.0 

5.5 

Ago. de 1987 

7.0 

7.0 

Feb. de 1987 

7.0 

5.5 

Sept, de 1987 

6.5 

6.5 

Marzo de 1987 

7.5 

5.5 

Oct. de 1987 

6.0 

6.0 

Abril de 1987 

7.0 

6.0 

Nov. de 1987 

6.0 

5.5 

mayo de 1987 

7.5 

6.5 





83T) 

745 


Debido a que Johnson argumento que la tasa de los fondos federales podria explicar la conducta de la tasa de 
descuentos, los fondos federales se ven como variable independiente. 

a. La naturaleza de la relation entre la tasa de fondos federales y la tasa de descuento puede analizarse a 
traves del an&lisis de regresion y de correlation. 

2X = 83 £P 2 = 469.25 

2K = 74.5 

IXY = 518.5 Y = 6.21 
XX 2 - 579 n = 12 
SCx = 4.9166667 
SCy = 6.72917 
SCxy = 3.20833 
= 0.6525 
b 0 = 1.6949 


Por tanto, 


y = 1.69 + 0.653 X 


El coeficiente de determinacion es: 


2 = (3-20833) 2 
r (4.92)(6.73) 

= 0.3111 
r = 0.56 

Los controladores de la Reserva tienen razdn en su critica de la tasa de los fondos federales como predictor 
de los cambios en la tasa de descuento. S61o el 31% de los cambios en la tasa de descuentos se explican 
mediante los cambios en la tasa de los fondos federales. 

b. Una medida de bondad de ajuste que refleja la capacidad de la tasa de los fondos federales para predecir 
la tasa de descuento es el error estdndar de estimacidn. 
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El error estandar de estimation es: 

SCE 


CME 

Se 

Tipicamente, el estimado de la tasa de descuento esta en error en 0.68 de un punto porcentual. 

c. Una prueba de la significancia del coeficiente de correlacion serfa muy util en este punto. Sea el nivel de 
confianza 95%. Con 10 grados de libertad el valor cntico de t es por tanto ± 2.228. 

Las hipotesis son: 


= SCy - 


= 6.7292 - 

= 4.63033 
= 4.63033 
10 

- 0.463033 

- V0.463033 
= 0.6808 


iSCxyf 
SCx 
(3.208) 2 
4.9166 


H 0 : p = 0 
H A :p* 0 


Regia de decision: “No rechazar si H 0 si t esta entre ± 2.228. De lo contrario rechazar”. 

r 

t = l 

_ r 

“ 2) 

= 0.56 

” V(1 - 0.31)/ 10 
= 0.56 
" 0.2627 
= 2.13 


La hipotesis nula no puede rechazarse. A pesar del hallazgo muestral de una relacion positiva entre las 
tasas de los fondos federales y la tasa de descuento, no se puede rechazar la hipotesis de que no hay 
correlacion. El coeficiente de correlacion muestral no es significativo al nivel del 5%. 

d . Una prueba de la significancia del coeficiente de regresion de b } = 0.6525424 tambien es sabia. La prueba 
se realizara al nivel de 99%. Con 10 grados de libertad el valor critico de t es ± 3.169. 

M A :p^0 

Regia de decision: “No rechazar si t esta entre ± 3.169. De lo contrario rechazar. La prueba 
requiere”. 
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Se 

VS Cx 

0.681/V492 = 0.307 
0.652542 
0.307 
2.126 

La hipotesis de que /3 = 0 no puede rechazarse. El valor para b, no es significativamente diferente de cero al 
nivel del 1%. Hay muy poca confianza o nada de confianza en la tasa de los fondos federales como predictor 
de la tasa de descuento. Serfa imprudente de parte de los inversionistas confiar en los fondos federales como 
indicador del comportamiento de la tasa de descuento y de otras tasas de interes. 

3. Analisis adicional de la tasa de descuento Con base en los resultados del problema anterior, el banquero 
profesional y los inversionistas pueden encontrar poco alivio en la habilidad de los fondos federales para 
predecir la tasa de descuento. Utilizando el modelo de regresion para elaborar un estimado puntual de la tasa 
de descuento no parece prudente. Para analizar aun mas la relacion entre estas dos variables, si existe alguna, 
se puede calcular los estimados por intervalo de la tasa de descuento. 

a. Las personas empleadas en la banca y las finanzas estarfan interesadas en un estimado por intervalo para 
el valor promedio de la tasa de descuento, si los fondos federales se mantuvieran constantes durante 
varios meses. Claro que esto es un estimado por intervalo de la media condicionada de la tasa de descuento: 


en donde: 




I.C. para /x v[jc = Y ± tS Y 

y requiere el calculo del error estandar de la media condicionada, S y y Y como estimador puntual de la tasa de 
descuento. Debido a que la tasa de los fondos federales parecia moverse alrededor del 7% con frecuencia, es 
en esta tasa en la que se calculara el intervalo de confianza. 


Para calcular S y y F, se tiene que: 


S r 



(X - X) 2 
SCx 


= 0.681 


J_ (7 - 6.9167) 2 
12 + 4.92 


= 0.1982 


Tambien, 


1 = K + b x X 
= 1.6949 + 0.6525424(7) 
= 6.2627 


Si se calcula el intervalo al nivel del 95% de confianza, el valor crftico de t es 1 005 n , = ± 2.228. Entonces se tiene 
que: 

I.C.para = Y ± tS r 

= 6.2627 ± (2.228X0.1982) 

5.82 < n yU < 6.70 
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Los banqueros pueden estar 95% seguros que si la tasa de los fondos federales es del 7% durante varios 
meses, la tasa de descuento promedio que deben pagar para prestar dinero de la Reserva Federal caera entre 
el 5.82% y el 6.70%. Sus planes y politicas pueden formularse de acuerdo a esta expectativa. 

b. Si un banquero desea hacer planes para el mes proximo, estarfa interesado en saber cual serfa la tasa de 
descuento para ese mes, dado que la tasa de los fondos federales era del 7%. El banquero, por tanto 
calculana un intervalo de prediction para el siguiente mes asf: 

I.C. para Y x ~Y± tS y . 


Esto requiere del calculo del error estandar del pronostico, S r Asumiendo un nivel de significancia del 95% 
y una tasa de los fondos federales del 7%, el banquero procederfa asf; 


c = wi + i + «- f)2 


sc x 


= 0.70927 


Debido a que Y = 6.2627, se tiene que 

I.C. para Y x = 6.2627 ± (2.228)(0.70927) 

4.68 < Y x < 7.85 

El banquero podrfa formular planes para las operaciones del proximo mes comprendiendo que el podrfa 
estar 95% seguro de que si la tasa de los fondos federales fue del 7%, la tasa de descuento quedarfa entre el 
4.68 y el 7.85%. Este es un rango mas amplio que el encontrado para la media condicionada de la tasa de 
descuento. 

Ciertamente parecerfa que es cuestionable la afirmacion de Johnson respecto al uso de la tasa de fondos 
federales para estimar o predecir la tasa de descuento. El r 2 es mas bien bajo y las pruebas para la significancia 
de p y [5 l sugieren que las hipotesis de p = 0 y Pj = 0 no pueden rechazarse en ninguno de los niveles 
aceptables de significancia. 

Para ser justo, debe argumentarse que la tasa de los fondos federales deberia retrasarse un mes. Es decir, 
la tasa de descuento en cualquier mes (perfodo t) es una funcion de la tasa de fondos federales para el mes 
anterior (perfodo t - 7). Esto permitirfa a la Reserva Federal un tiempo para ajustar la tasa de descuento a la tasa 
del ultimo mes de los fondos federales, ya que la Reserva Federal no puede responder inmediatamente a los 
cambios en la tasa de los fondos federales. Esto se expresa asf: 

TD=f(FFJ 

en donde TD es la tasa de descuento y FF es la tasa de los fondos federales. Este modelo retrasado da: 

Y = 0.6 + 0.8X 

Con r 2 = 60% y Se = 0.47. Esto representa una mejora sobre el modelo natural, el cual no incluye la variable 
retrasada. 

4. El efecto de productividad sobre el PIB real Una emision reciente de la revista Fortune informo la relation 
entre la productividad de los trabajadores y las tasas de cambio en el nivel de production de la nacidn, medida 
en terminos reales. El mensaje era que el incremento de productividad durante los anos 80 podrfa servir como 
factor explicativo para el crecimiento del PIB. Con el crecimiento en la productividad y los cambios en el PIB 
medidos en porcentajes, y el PIB como variable dependiente, los datos anuales para ese perfodo puede 
resumirse asf: 
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El modelo es: 


IX - 32.5 2Y 2 = 483.72 

IY = 62.2 n = 9 

IXY = 255.4 2X 2 = 135.25 

y = 0.69596273 + 1.721 118X 


el que indica que si la productividad incremento un punto porcentual, el PIB real incremental en 1 .72%. r 2 es 
0.98407, ySe = 0.35. 


Para efectos de formular la politica nacional tributaria, la cual argumentan algunos economistas al margen 
de la oferta, tiene un impacto directo en la productividad de los trabajadores. Los miembros de planeacion de 
Washington probaron la significancia tanto del coeficiente de correlation muestral como del coeficiente de 
regresion muestral. Cada uno probo ser significativo al nivel del 10%. 


Elios mismos solicitaron luego un intervalo de confianza por cada coeficiente poblacional a un nivel del 
10%: 


I.C.para 0, = b x ± tS bx 

S„ = ~^L= = 0.08275 
' Vsc x 

I.C.para f3 t = 1.72 ± (1.895)(0.08275) 
1.56 </3, < 1.88 


Los miembros de planeacion pueden basar la formulacion de la politica tributaria nacional en la condicion de 
que pueden estar 90% seguros de que el coeficiente de regresion poblacional esta entre 1.56 y 1 .88. 


Lista de formulas 


[11.3] 

[11-9] 

[ 11 . 10 ] 

[ 11 . 11 ] 

[ 11 - 12 ] 


Y = b 0 + b { X 


SCx = IX 2 - 
SCy = 1Y 2 - 


(IX) 2 

n 

Gy) 2 


■ sxr - ( - xy) g y) 


= 


SC. xy 




[11.13] 

[11-14] 


^0 
d = 


= y - b { x 

2(e ( - e t „ x ) 2 


Formula para una recta que tiene 
intercepto, b 0 , y pendiente, b r 

Suma de cuadrados para X 
Suma de cuadrados para Y 


Suma de productos cruzados 

La pendiente de la recta de 
regresion mide el cambio unitario 
en y dado un cambio unitario en X. 

El intercepto es el valor de Y 
cuando X es igual a cero. 


El estadfstico de Durbin- Watson 
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El error estandar de estimation es 

[11.15] 

Se=J* Y ‘-*‘ )2 

V n — 2 

la medida de la dispersion de los 
valores de Y alrededor de su 

[11.16] 

SCE =SCy - — — - 
7 SCx 

media. 

Suma de cuadrados del error 

[11.17] 

SCE 

CME — 

n — 2 

Cuadrado medio del error 

El error estandar de estimation es 

[11.18] 

Se = VCME 

la medida de la dispersion de los 
valores de Y alrededor de su 
media. 

[11.19] 

SCT = 2(y, - F) 2 

Suma de cuadrados total 

[11.20] 

SCR = 2(F, - F) 2 

Suma de cuadrados de la 
regresion 

[1121] 

sce = 2(y ; - F,) 2 

Suma de cuadrados del error 

[11.22] 

(sCR 
r yj SCT 

Coeficiente de correlacion 

[11.23] 

SCxy 

V$Cx)(SCy) 

Forma de calcular el coeficiente 
de correlacion 

[11.24] 

2 SCR 
r SCT 

Coeficiente de determination 

[11.25] 

,.2 _ &Cry) 2 
(SGcXa» 

Forma de calcular el coeficiente 
de determination 

[11.26] 

f _ *1 " /». 

Prueba t para el coeficiente de 
regresion poblacional 

[11.27] 

5 = & 

*• vScc 

Error estandar del coeficiente de 
regresion 

Intervalo de confianza para el 

[11.28] 

I.C.para 0, = Z>, ± Kj*,) 

coeficiente de regresion 
poblacional 

[11.29] 

t= r- P 

s r 

Prueba t para el coeficiente de 
correlacion poblacional 

[11.30] 


Error estandar del coeficiente de 


' Vfl - 2 

correlacion 

[11.31] 

r „ /i (x, + F) 2 

S. = Se-v/- + — 

r V/I SOt 

Error estandar de la media 
condicionada 

[11.32] 

I.C. para /x^j, = ± 

Intervalo de confianza para la 
media condicionada 

[1133] 

s r sJl- L + (X '- & 

K V « SCr 

Error estandar de prondstico 

[11.34] 

I.C. para Y x = F, ± ts Yi 

SCR - 

SCx 

Intervalo de confianza para el 
intervalo de prediction 

[11.35] 

Suma de cuadrados de regresidn 
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Ejercicios del capi'tulo 

41 . Los residentes de un pueblo pequeno estan preocupados sobre el incremento en los costos de la vivienda en 
la zona. El alcalde considera que los precios de la vivienda fluctuan con los valores de la tierra. Los datos 
sobre 10 casas vendidas recientemente y el costo del terreno sobre el cual se construyeron se observan en la 
siguiente tabla en miles de dolares. Se trata el costo de las casas como la variable dependiente. Haga e 
interprete el modelo de regresion. Sobre esta base ^parece que el alcalde esta en lo cierto? 


Valores de la tierra 

Costo de la casa 

Valores de la tierra 

Costo de la casa 

7.0 

67.0 

3.8 

36.0 

6.9 

63.0 

8.9 

76.0 

5.5 

60.0 

9.6 

87.0 

3.7 

54.0 

9.9 

89.0 

5.9 

58.0 

10.0 

92.0 


42 . Calcule e interprete el coeficiente de determination para el ejercicio 4 1 . 

43 . Pruebe la hipotesis de que los valores de la tierra son significantes al nivel del 10% en el ejercicio 41. 

44 . Calcule e interprete el intervalo de confianza del 90% para el coeficiente de regresion en el ejercicio 41. 

45 . El gobiemo estudiantil en la universidad local intenta determinar si el precio de admision al salon de juegos 
del centra estudiantil tiene un impacto en el numero de estudiantes que utilizan las instalaciones. El costo de 
admision y el numero de estudiantes que ingresan al salon se registran durante 12 viemes seguidos y se 
muestran en la siguiente tabla. Haga e interprete el modelo de regresion. 


Precio 

Numero de boletas 

Precio 

Numero de boletas 

US$1.25 

95 

US$1.00 

98 

1.50 

83 

1.50 

85 

1.75 

75 

2.00 

75 

2.00 

72 

2.50 

65 

2.10 

69 

1.10 

98 

1.00 

101 

1.50 

86 


46 . Calcule e interprete el intervalo de confianza del 99% para el coeficiente de regresion en el ejercicio 45. 

47 . Para reducir los crfmenes, el presidente ha presupuestado mas dinero para poner mas policia en las calles de 
nuestra ciudad. i Que information ofrece el modelo de regresion con base en estos datos sobre el numero de 
policias en patrullas y el numero diario de cnmenes reportados? Utilice las formulas para ilustrar que el 
modelo MCO realmente se basa en las desviaciones con respecto a la media calculando, 


SC: k - ?.(X - X) 2 SCy = 2(F - Y) 2 
SCxy = 2(X - X)(Y - Y) 
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Policta 

Numero de crimenes 
reportados 

13 

8 

15 

9 

23 

12 

25 

18 

15 

8 

10 

6 

9 

5 

20 

10 


48. Tfa Bea desea obtener este verano mas rendimiento de sus plantas de tomate Big Boy incrementando el 
numero de veces que utiliza fertilizante. Con base en los datos mostrados aquf, ^el coeficiente para el modelo 
de regresion sugiere que esto es posible? Utilice las formulas para ilustrar que el modelo MCO se basa en las 
desviaciones con respecto a la media calculando 

SCx = 2(X - X) 2 SCy = 2(K - Y) 2 
SCxy = 2(X - X)(y - ?) 


Uso de fertilizante 

Rendimiento (libras) 

4.00 

12.00 

9.00 

20.00 

5.00 

15.00 

8.00 

17.00 

2.00 

7.00 


49. Doce distritos escolares en el area de Chicago estan interesados en saber si el incremento en las tasas de 
impuesto predial podrian relacionarse con el numero de alumnos en clase de las escuelas locales. ^Parece ser 
este el caso con base en los datos que se muestran a continuation? 


Tasas de valorizacion 

Estudiantes por clase 

Tasas de valorizacion 

Estudiantes por clase 

1.20 

32 

1.30 

25 

1.20 

36 

1.30 

21 

1.10 

25 

1.20 

35 

1.30 

20 

1.40 

16 

1.10 

39 

1.40 

39 

1.20 

42 

1.30 

37 


a. Si se piensa que mas alumnos requieren impuestos mas elevados, ^cual es la variable dependiente? Calcule 
e interprete el modelo de regresion. ^Las clases mas grandes parecen estar relacionadas con los impuestos 
mds altos? 
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b . Calcule e interprete el coeficiente de determinacion y el coeficiente de correlacion. ^Parece ser util este 
modelo? 

c. Calcule e interprete el error estandar de estimacion. 

50. Pruebe la significance tanto para el coeficiente de correlacion como para el coeficiente de regresi6n a un nivel 
del 10% para el ejercicio 49. ^Que le dicen los resultados? 

51. Calcule e interprete el intervalo de confianza del 95% para /3 ; en el ejercicio 49. 

52. Con base en las cifras presentadas por el servicio de renta interna (SRI), un grupo nacional de ciudadanos ha 
expresado su preocupacion porque el presupuesto para este no sea utilizado efectivamente. El SRI argumento 
que el incremento en el numero de contribuyentes que presentan su declaracion de renta explica los problemas 
de presupuesto. A continuacion se proporcionan los datos relevantes: 


Ano 

Declaracion de renta 
(en millones) 

Presupuesto del SRI 
(en miles de millones de dolares) 

1 

116 

US$6.7 

2 

116 

6.2 

3 

118 

5.4 

4 

118 

5.9 

5 

120 

3.7 

6 

117 

5.9 

7 

118 

4.7 

8 

121 

4.2 


a. Construya el modelo de regresion, ^parece plausible el argumento del SRI? 

b. Calcule e interprete el coeficiente de determinacion. 

c. Calcule e interprete el error estandar de estimacion. 

53. Cual es el intervalo de confianza del 95% para el intervalo de prediction del ejercicio 52 si hay 1 19 declaraciones 
registradas? 

54. Una teorfa financiera popular sostiene que existe una relacion directa entre el riesgo de una inversion y el 
rendimiento que promete. El riesgo de una accion se mide por medio de su valor p. A continuacion se 
presentan los rendimientos y los valores /3 para 12 acciones ficticias sugeridas por la empresa de inversiones 
de Guess & Pickum. ^Estos datos parecen confirmar esta teorfa financiera de una relacion directa? 


Accion 

Rendimiento (%) 

Valor p 

Accion 

Rendimiento (%) 

Valor p 

1 

5.4 

1.5 

7 

5.3 

1.3 

2 

8.9 

1.9 

8 

0.5 

-0.5 

3 

2.3 

1.0 

9 

1.3 

0.5 

4 

1.5 

0.5 

10 

5.9 

1.8 

5 

3.7 

1.5 

11 

6.8 

1.9 

6 

8.2 

1.8 

12 

7.2 

1.9 


Tipicamente los inversionistas consideran el rendimiento como una funcion del riesgo. Utilice una interpretation 
tanto del coeficiente de regresion como del coeficiente de correlacion en su respuesta. 
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55 . El servicio de emergencia para ciertas areas rurales de Ohio con frecuencia es un problema, especialmente 
durante los meses de inviemo. El jefe del Departamento de Bomberos de Danville, Township esta preocupado 
por el tiempo de respuesta a las llamadas de emergencia. Ordena una investigation para determinar si la 
distancia del lugar de la llamada, medida en millas, puede explicar el tiempo de respuesta, medido en minutos. 
Con base en 37 emergencias, se recolectaron los siguientes datos: 

IX = 234 IX 2 =1,796 

If = 831 2Y 2 = 20,037 

ZXY = 5,890 

a. <[Cual es el tiempo de respuesta a una llamada que proviene de ocho millas de la estacion de bomberos? 

b. iQue tan dependiente es dicha estimacion, con base en el grado de dispersion de los puntos de datos 
alrededor de la recta de regresion? 

56 . Refiriendonos al ejercicio 55, a un nivel de confianza del 90%, que puede decir sobre la significancia del: 

a. ^Coeficiente de regresion? 

b . ^Coeficiente de eorrelaeion? 

57 . Respecto al ejercicio 55, con un nivel de confianza del 90%, ^que intervalo de tiempo predecina usted para una 
llamada proveniente Zeke Zipple, quien vive a 10 millas de la estacion de bomberos? 

58 . Respecto al ejercicio 55, con un nivel de confianza del 90%, ^cual es el intervalo de tiempo promedio que 
usted predecina para muchas llamadas provenientes de una distancia de 10 millas de la estacion? 

59 . Utilizando los datos del ejercicio 55, el jefe de bomberos esta interesado en una estimacion del 95% para el 
coeficiente de regresion poblacional. Interprete sus resultados para el jefe. 


Ejercicios en computador 

Usted acaba de ser contratado por su nuevo suegro, presidente de Jesse James National Bank. Su primera tarea 
es estimar un modelo de regresion que predecira los depositos. Su suegro ha sugerido varias variables explicativas, 
incluyendo las tasas de interes, un mdice para el clima economico general en la zona, y el numero de negocios 
recientemente constituidos. Usted tambien considera que los niveles poblacionales podrfan utilizarse como un 
predictor. 

Usted ha recolectado datos para todas estas variables y debe decidir ahora cual puede utilizarse mejor como 
variable explicativa, pues usted desea especificar un modelo de regresion simple (en realidad todas las variables 
pueden ser significativas en un modelo de regresion multiple al igual que las analizadas en el siguiente capftulo). 
Ingrese al archivo “BANK” en su disco de datos. Este contiene los datos de los depositos (DP) en millones de 
dolares, la tasa de interes (INT) que el banco paga por los depositos, un indice de la actividad economica (IAC), 
la poblacion (POP) en cientos para diferentes areas en las cuales se encuentran ubicadas sucursales del banco, y 
el numero de nuevos negocios (NEG) en tales areas. 

Compare el poder explicativo de cada variable en modelos de regresion simple independientes. Proporcione 
un analisis comparative de cada modelo con respecto a todas las caracteristicas de regresion y eorrelaeion que 
usted considere que pueden proporcionar alguna information util. ^Cual modelo recomendaria usted? Prepare su 
informe estadfstico final como se describe en el apendice I. 
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D PUESTA EN ESCENA 


La guerra de las “Colas” entre Coca Cola y Pepsi, que se 
menciond en la seccidn denominada Escenario a comienzos 
de este capftulo, discutfa los esfuerzos realizados por las 
dos companias por ganar participacidn en el mercado a 
expensas una de la otra. Cada una ha intentado varias 
estrategias para lograr estas metas. Ninguna companfa 
parece interesarse en participar en una guerra de precios 
prolongada para incrementar las ventas. Pepsi ha confiado 
plenamente en nombres de celebridades, utilizando 
personalidades muy conocidas para promover su producto, 
mientras que Coca-Cola parece preferir los esquemas 
promocionales relacionados con pelfculas populares y 
heroes de tiras comicas. 

Como analista de Coca-Cola, su trabajo es utilizar los 
datos proporcionados aquf para saber si los cambios en los 


precios son efectivos para promover las ventas. Estos 
datos se tomaron de los mercados de prueba seleccionados 
en toda la nacidn para paquetes de 12 botellas de cada 
bebida. Las ventas se aproximaron a la unidad mis prdxima 
en miles. 

Utilice todas las herramientas de regresion y correlacion 
que aprendio en este capftulo para analizar completamente el 
impacto de los cambios en precios en las ventas para ambos 
productos. Desarrolle e interprete el modelo de regresion 
para ambas companias haciendo regresidn de las ventas sobre 
el precio. Construya e inteiprete todos los intervalos de 
confianza y prueba todas las hipotesis pertinentes. ^Parece 
que una companfa ha sido mis exitosa en el uso de los 
cambios en precios para promover las ventas? Como 
empleado de Coca-Cola, ^que recomendarfa usted? 


Ventas de Pepsi 

Precio de Pepsi 

Ventas de Coca-Cola 

Precio de Coca-Cola 

25.00 

US$2.58 

35.00 

US$2.10 

21.00 

3.10 

25.00 

3.52 

18.00 

3.25 

21.00 

2.10 

35.00 

2,10 

19.00 

2.55 

29.00 

2.90 

23.00 

3.50 

24.00 

2.85 

31.00 

2.00 

18.00 

4.21 

24.00 

3.50 

16.00 

5.26 

31.00 

2.99 

18.00 

5.85 

20.00 

2.99 

32.00 

2.50 

19.00 

2.25 


Del escenario a la vida real 

i,De qud lado esti en la guerra de Coca-Cola y Pepsi? ^Guiles son sus razones? ^Sabe usted cuil producto esti 
ganando la guerra y por cuinto? Visite los sitios Web de estas companias para ayudar a responder estas preguntas. 
Primero visite el sitio de Coca-Cola (www.cocacola.com/sports). Explore y haga un listado de las zonas caracterfsticas 
en Coke Home Page. Algunas ireas son About the Coca-Cola Company (Sobre la empresa Coca-Cola), una tienda 
de regalos, y la zona de juegos. En la seccidn About the Coca-Cola Company haga clic en cada uno de los botones 
de la miquina expendedora para aprender diferentes hechos sobre la empresa de interns para los inversionistas. 



CAPITULO 11 • Regresion simple y correlation 373 


6 En alguna information de estas se menciona a Pepsi? Sobre todo, £el sitio esta dirigido mas hacia el consumidor 
o hacia el inversionista? ^Cuales estrategias competitivas de mercadeo, diferentes al precio, se sugieren en este 
sitio, por ejemplo cobrables y una tienda de regalos? 

Ahora visite el sitio de Pepsi ( www.pepsico.com ). Haga una lista de las zonas de caracteristicas de este Home 
Page. Sobre todo, £el sitio esta dirigido a los consumidores o a los inversionistas? ^Que estrategias competitivas 
de mercadeo diferentes al precio se sugieren en este sitio? Haga clic en el area de Annual Report (reporte anual). 
Luego seleccione “PepsiCo Facts” seguido por “beverages”. Lea toda la information factica. ^Hay grdficas que 
muestren la participation en el mercado mundial y de Estados Unidos? Si es asf, ^Cuil es la participacidn de 
mercado para Coca-Cola y para Pepsi? ^,Que motivos se sugieren para los vacfos en la participation de mercado 
a traves de sus visitas a los sitios Web de estas dos companfas? 





Plan del capitulo 

En un modelo de regresion, al utilizar mas de una variable explicativa es posible incrementar el poder explicativo 
y la utilidad del modelo en la toma de muchas decisiones de negocios. Este capitulo discute la construction de 
dichos modelos de regresion multiple y muestra como pueden utilizarse para facilitar la toma de decisiones en los 
negocios. 
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E S C E N A R I 0 


Como preparation para su grado, a finales de este ano, 
usted ha asumido el cargo de practicante con Griffen 
Associates, una empresa de inversiones en Chicago. Como 
medida de sus habilidades financieras, la compama le ha 
encomendado la tarea de analizar el desempeno del mercado 
de los fondos mutuos que operan como competencia de 
Griffen. Se han recolectado datos para el rendimiento de 
tres anos (R3A) y para el rendimiento de un ano (R1A) 
para 15 fondos competitivos. 

El Sr. Griffen le solicita un informe sobre el desempeno 
de estos competidores, con base en diversos factores, 
incluyendo sus tasas de rendimiento, sus activos totales, y 
si cada fondo tiene una partida de carga por ventas. 

Existe un interns en particular en Griffen Associates de 
saber si ha habido algun cambio durante los ultimos tres 


anos en el desempeno de estos fondos. Griffen estd 
considerando cambios significativos en muchos de sus 
procedimientos operativos y ciertos gerentes que han 
estado con la firma durante varios anos estan preocupados 
sobre los resultados de tales cambios. A1 analizar el 
comportamiento de las empresas competitivas a traves 
del tiempo, estos gerentes consideran que ganan algun 
discernimiento para la futura direccidn de Griffen 
Associates. 

Este proyecto requerira que usted configure y analice 
un modelo de regresion multiple que pueda proporcionar 
la information necesaria para discemir y establecer los 
procedimientos operativos importantes que Griffen 
Associates esta considerando. 


Uso de las tasas de rendimiento para analizar los rendimientos de tres 
anos y de un ano 



12.1 Introduction 


En el capftulo 1 1 se analizo como una sola variable explicativa podrfa utilizarse para predecir el valor de la variable 
dependiente. Se considera cuanto mas poderoso podrfa volverse el modelo si se utilizaran mas variables explicativas. 
Esto es precisamente lo que el modelo de regresion multiple hace, permitiendo incorporar dos o mas variables 
independientes. El modelo de regresion multiple con k variables independientes se expresa como: 


El modelo de regresion 
multiple 


Y = £o + P\ x i + £ 2 X 2 + + /3/Xk + e [12.1] 
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en donde p. son los coeficientes de regresion y £ es el termino de error aleatorio. Se estima el modelo utilizando los 
datos muestrales asi: 


El modelo 



de regresion 
multiple estimado 

Y = b 0 + b l X l + b 2 X 2 + ■ ■ ■ + b k X k 

[12.2] 


en donde Y es el valor estimado para la variable dependiente y b. son los estimados para los coeficientes 
poblacionales P i Los b. se denominan coeficientes parciales (o netos) de regresion y tienen la misma interpretation 
que en la regresion simple. Por tanto, b } , es la cantidad por la cual Y cambiara si X } cambia en una unidad, 
asumiendo que todas las otras variables independientes se mantienen constantes. Esta suposicion no fue 
necesaria bajo la regresion simple porque no habia otras variables independientes para mantener constantes. 

La regresion multiple implica los mismos supuestos citados en el capitulo anterior para la regresion simple, 
mas otros dos. El primer supuesto requiere que el niimero de observaciones n , exceda el numero de variables 
independientes k , en por lo menos 2. En la regresion multiple hay k + 1 parametros por estimar: los coeficientes 
para las variables independientes k mas el termino del intercepto. Por tanto, los grados de libertad relacionados 
con el modelo son g.l. = n - (k+ 1). Si se va a retener incluso un grado de libertad, n debe exceder a k en por lo 
menos 2, de manera que n - (k + 1) es por lo menos 1 . 

El segundo supuesto involucra la relacion entre las variables independientes. Requiere que ninguna de las 
variables independientes este linealmente relacionada. Por ejemplo, si X x =X 2 + X y o quiza X ] - 0.5X,, entonces 
una relacion lineal existirfa entre dos o mas variables independientes y surgirfa un problema grave. Este problema 

es la multicolinealidad. 


Multicolinealidad La multicolinealidad existe si dos o mas variables independientes 
estan relacionadas linealmente. 


La multicolinealidad puede hacer que los signos algebraicos de los coeficientes sean opuestos a lo que la logica 
puede dictar, mientras que incrementan vastamente el error estandar de los coeficientes. Un analisis mas completo 
sobre multicolinealidad se hara mas tarde en este capitulo. 


12.2 El modelo de regresion multiple para Hop Scotch 
Airlines 

En el capitulo 11, Hop Scotch Airlines utilizo publicidad, en un modelo de regresion simple, para explicar y predecir 
el numero de pasajeros. El modelo tenia un error estandar de 0.907 y r 2 del 94%. Se supone que Hop Scotch desea 
incorporar una segunda variable explicativa dentro de su modelo para explicar el numero de pasajeros. Con base 
en el principio de que el ingreso es la determinante primaria de la demanda, Hop Scotch escoge el ingreso nacional 
como segunda variable. El modelo se vuelve entonces 


El modelo regresion multiple 
para Hop Scotch 


Y = b 0 4- b]X { + b 2 X 2 


[ 12 . 3 ] 






378 ESTADISTICA APLICADA A LOS NEGOCIOS Y LA ECONOMIA 


Con dos variables explicativas, un diagrama de dispersion puede elaborarse en un espacio tridimensional formando 
un piano de regresion, como se observa en la figura 12. 1 . La variable dependiente se coloca en el eje vertical unico. 
Un modelo con tres o mas variables independientes requieren un hiperplano y es dificil de representar graficamente. 


Figura 12.1 

Plano de regresion 
para Hop Scotch 
Airline 



en donde Y es el valor proyectado para los pasajeros expresado en miles 
es la publicidad expresada en cientos de dolares 
X 2 es el ingreso nacional expresado en dolares. 


Plano de regresion Los coeficientes de las dos variables independientes se representan 
mediante las pendientes del piano de regresion. 


Los valores para b f/ b ; y b , en la formula (12.3) se hallan como los de la regresion multiple. Se desean 
estimaciones de los coeficientes que minimizan la suma de los errores al cuadrado: X ( K - L) : Esto proporcionara 
el modelo de mfnimos cuadrados que se ajuste mejor a los datos que se muestran en la tabla 12.1. La ultima 
columna representa la nueva variable del ingreso nacional en billones de dolares. 


Tabla 12.1 

Datos de la regresion 
multiple para Hop 
Scotch Airlines 


Observacion 

(meses) 

Pasajeros ( Y) 
(en miles) 

Publicidad (*,) 

(en miles de dolares) 

Ingreso nacional X 2 
(en billones de dolares) 

1 

15 

10 

2.40 

2 

17 

12 

2.72 

3 

13 

8 

2.08 

4 

23 

17 

3.68 

5 

16 

10 

2.56 

6 

21 

15 

3.36 

7 

14 

10 

2.24 

8 

20 

14 

3.20 

9 

24 

19 

3.84 

10 

17 

10 

2.72 

11 

16 

11 

2.07 

12 

18 

13 

2.33 

13 

23 

16 

2.98 

14 

15 

10 

1.94 

15 

16 

12 

2.17 
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Calcular un modelo de regresion multiple manualmente es muy tedioso y demanda mucho tiempo. El 
procedimiento requiere k + 1 ecuaciones simultaneas con k + 1 desconocidas, en donde k es el numero de 
variables al lado derecho. Por tanto, se dispensara todo esfuerzo para solucionar manualmente el modelo de 
regresion y se confiara solamente en el computador para la mayorfa de los calculos. La atencion se centrara en los 
fundamentos necesarios para comprender e interpretar el modelo de regresion multiple. 

La pantalla 12.1 es una impresion en Minitab para los datos que aparecen en la tabla 12.1. Se puede observar 
claramente que si se aproximan los coeficientes para facilitar en algo la discusion, el modelo es 

Pass = 3.53 + OMAdv + 1 .44M 

en donde Pass , Adv y NI son pasajeros en miles, gastos publicitarios en miles de dolares e ingreso nacional en 
billones de dolares, respectivamente. Por tanto, el modelo predice que si se incrementa la publicidad una unidad 
(US$1,000), los pasajeros aumentaran 0.84 unidades (840 pasajeros) si el ingreso nacional no cambia. Ademas, si 
el ingreso nacional incrementa en una unidad (US$ 1 billon), los pasajeros incrementaran en 1 ,440, si la publicidad 
se mantiene constante. 


Pantalla 12.1 


Regression Analysis (Analisis de regresion) 


The regression equation 

is {La ecuacion 

de regresion es) 

PASS 

= Pasajeros 

PASS =3.53 

+ 0.840 ADV 

+ 1.44 NI 




ADV 

= Publicidad 







Stdev 

= Desviacion 

Predictor 

Coef 

Stdev 

t- 

■ratio 

P 


estandar 

Constant 

3.5284 

0.9994 


3.53 

0.004 

t-ratio 

= razon t 

ADV 

0.8397 

0.1419 


5.92 

0.000 

R-sq 

= r 2 

NI 

1.4410 

0.7360 


1.96 

0.074 

DF 

= Grados de 


liber tad 

s = 0.8217 R-sq = 95.3% R-sq (adj) =94.5% ss = Suma de 


cuadrados 


Analysis of 

Variance 




MS 

= Cuadrado 








medio 

SOURCE 

DF 

SS 

MS 

F 

P 

NI 

= Ingreso 

Regression 

2 

163.632 

81.816 

121.18 

0.000 


nacional 

Error 

12 

8.102 

0.675 





Total 

14 

171.733 






SOURCE 

DF 

SEQ SS 






ADV 

1 

161.044 






NI 

1 

2.588 







12.3 Evaluation del modelo 

Despues de haber estimado el modelo, es necesario evaluarlo para determinar si proporciona un ajuste y explication 
satisfactorios para los datos que se han recolectado. Existen varias pruebas que pueden practicarse para tomar 
esta decision. Estas pruebas son muy similares a las realizadas en el modelo de regresion simple. Sin embargo, 
como se anoto anteriormente, se enfatizara en los fundamentos que se encuentran tras estas pruebas, dejando los 
calculos reales al computador. Los calculos matematicos y formulas necesarias se presentaran solo para demostrar 
conceptualmente para que esta disenada la prueba. 
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A. El error estandar de estimacion 

A1 igual que la regresion simple, el error estandar de estimacion puede utilizarse como medida de bondad de 
ajuste. Tiene la misma interpretacion que con la regresion simple. Mide los grados de dispersion de los valores Y. 
alrededor del piano de regresion, tal como se observa en la figura 12.2. Claro que entre menos dispersion se 
presente, mas pequeno sera el Se y mas preciso sera el modelo en su prediction y pronostico. 


Figura 12.2 

Plano de regresion 
para Hop Scotch 


Y Y i 



El error estandar se calcula de la misma forma que la regresion simple. 


El error estandar de estimacion 

S'=J s(r ';V 

[12.4] 


V n - k — 1 



en donde n - k - 1 es el numero de grados de libertad y k es el numero de variables a la derecha. El numerador bajo 
el radical de la formula (12.4) es la suma de los errores elevada al cuadrado y se minimizara de acuerdo con el 
concepto de imnimos cuadrados ordinarios. La pantalla 12.2 muestra una impresion en Minitab de los valores 
reales para los pasajeros (K), el valor proyectado para los pasajeros (T), y el error (Y. - Y), y el error al cuadrado 
(Y. - Y)\ La suma de esta ultima columna es la suma de los errores al cuadrado y se tiene que es 8.1016. El error 
estandar entonces sera: 


Se = 


8.1016 

15-2-1 


0.8217 


Pantalla 12.2 

Hop Scotch Data (Datos de Hop Scotch) 


Row 

PASS 

Y, 

i 

Y-HAT 

1 

RESIDUAL 

< Y i - 

RESDSQ 
(Yi - ^i) 2 

RESDSQ = Cuadrado residual 

Row = Fila 

1 

15 

15.3834 

-0.38338 

0.14698 

PASS = Pasajero 

2 

17 

17.5238 

-0.52382 

0.27438 


3 

13 

13.2429 

-0.24294 

0.05902 


4 

23 

23.1055 

-0.10547 

0.01112 


5 

16 

15.6139 

0.38607 

0.14906 



(Continua) 
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6 

21 

20.9650 

0.03497 

0.00122 

7 

14 

15.1528 

-1.15282 

1.32900 

8 

20 

19.8948 

0.10519 

0.01106 

9 

24 

25.0154 

-1.01536 

1.03095 

10 

17 

15.8445 

1.15551 

1.33521 

11 

16 

15.7475 

0.25248 

0.06375 

12 

18 

17.8015 

0.19850 

0.03940 

13 

23 

21.2571 

1.74287 

3.03761 

14 

15 

14.7205 

0.27947 

0.07810 

15 

16 

16.7313 

-0.73128 

0.53477 


MTB > 8.10106 


La impresion en Minitab en la pantalla 12.1 muestra el error estandar como 0.8217. Esto representa una mejoria 
sobre el error estandar del modelo de regresion simple en el capitulo anterior, el cual se informo que era 0.907. 


B. Coeficiente de determination multiple 

A1 igual que con la regresion simple, el coeficiente de determinacion multiple se utiliza como una medida de 
bondad de ajuste. En aras de la conveniencia, el termino multiple se supone con frecuencia dado el contexto de 
la discusion, y la expresion se abrevia al coeficiente de determinacion, lo mismo que para el modelo de regresion 
simple. Otra similitud entre el modelo simple y un modelo que contiene dos o mas variables explicativas es la 
interpretation del coeficiente de determinacion. En ambos casos, la porcion del cambio en Y se explica mediante 
todas las variables independientes en el modelo. 


Coeficiente de determinacion Es el que mide la fuerza de la relacion entre Y y las 
variables independientes. 


Para medir dicha porcion del cambio total en Y, explicada por el modelo de regresion, se utiliza la relacion de la 
variacion explicada con la variacion total, de la misma manera como se hizo en el caso de la regresion simple. Como 
se dijo en el capitulo 1 1, por variacion se entiende la variacion en los valores Y observados (7.) de su media (y). 
La variacion en Y, que se explica mediante el modelo, se refleja por la suma de los cuadrados de la regresion (SCR). 
La variacion total en Fes a su vez medida por la suma total de cuadrados (SCT). Por tanto, 


Coeficiente de determinacion P 2 _ scr 

multiple SCT 

[12.5] 

Debido a que SCT = SCR + SCE , tambien se tiene que: 

n 2 _ , SCE 

K ~ 1 SCT 

[12.6] 


Vale la pena destacar que el coeficiente es r 2 en el modelo simple y R 2 en la discusidn actual. 
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De la impresion en Minitab de la pantalla 12.1 que se mostro anteriormente, observamos que: 

P 2 = SCR 
SCT 

= 163632 
~ 171.733 

= 0.953 

El R 2 tambien puede leerse directamente de la pantalla 12. 1 como R - sq = 95.3%. Asi, el 95.3% del cambio en el numero 
de pasajeros que transporta Hop Scotch se explica mediante los cambios en la pubiicidad y en el ingreso nacional. 
Esto se compara de manera favorable con r 2 = 0.93 para el modelo de regresion simple del capitulo 1 1 que contiene 
solo pubiicidad. A1 incorporar NI (national income o ingreso nacional) como segunda variable independiente, se ha 
incrementado el poder explicativo del modelo de 93 a 95.3%. A1 igual que con el modelo de regresion simple, siempre 
se encuentra que 0 <R 2 <1 . Claro que entre mayor sea R 2 , mayor poder explicativo tendra el modelo. 

C. El coeficiente de determination corregido 

Debido a su importancia, R 2 se reporta en la mayorfa de los paquetes de computador. Es una forma rapida y facil 
de evaluar el modelo de regresion para determinar que tan bien se ajusta el modelo a los datos. Ademas de los 
coeficientes de regresion en si mismos, R 2 es quizas el estadistico mas comunmente observado y el que se 
observa mas de cerca en el analisis de regresion. 

Sin embargo, para estadisticos descuidados -o poco escrupulosos- es posible inflar artificialmente R 2 . Se 
puede incrementar/? 2 simplemente adicionando otra variable independiente al modelo. Incluso, si alguna variable 
absurda sin un poder realmente explicativo se incorpora al modelo, R 2 aumentara. Hop Scotch podrfa “inflar” su 
R 2 adicionando al modelo como variable explicativa, las toneladas de trucha de mar que los practicantes de pesca 
deportiva cogen en la costa de Florida. Ahora, obviamente la pesca no tiene nada que ver con la lista de pasajeros 
de Hop Scotch. Sin embargo, probablemente existe aunque sea una pequena correlacion casual, bien sea positiva 
o negativa, entre la pesca y el viaje aereo. Incluso un diminuto grado de correlacion inflara R 2 . Al sumar varias de 
estas variables explicativas “absurdas”, R 2 podrfa incrementarse de manera ilegitima hasta que se aproximara al 
100%. Un modelo de esta naturaleza puede parecer que se ajusta muy bien a los datos, pero producirfa resultados 
infortunados en todo intento por predecir o pronosticar el valor de la variable independiente. 

Por consiguiente, es una practica comun en regresion multiple y correlacion reportar el coeficiente de 
determinacion corregido. Representado con el simbolo R 2 , y se lee 4 7? barra al cuadrado”, este estadistico se 
ajusta a la medida del poder explicativo para el numero de grados de libertad. Debido a que el grado de libertad 
para SCE csn-k-l, agregar otra variable explicativa termina en la perdida de otro grado de libertad. R 2 decrecera 
si se adiciona una variable que no ofrece suficiente poder explicativo como para justificar su perdida en los grados 
de libertad. Si se reduce demasiado, se debe considerar su retiro. 

El coeficiente de determinacion corregido se obtiene dividiendo SCE y SCT por sus respectivos grados de 
libertad. 


Coeficiente de determinacion = j __ scE/(n ~ k ~ l) 

multiple corregido scr/(n - l) 


[ 12 . 7 ] 


Una formula mas conveniente a nivel computacional para R 2 es: 


Coeficiente de determinacion 
multiple corregido 


[ 12 . 8 ] 
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Debido a que el numerador de la formula (12.7) es el CME , puede decirse que R 2 es una combination de dos 
medidas del desempeno del modelo de regresion: el cuadrado medio de error y el coeficiente de determinacion. 

Los datos para el modelo de Hop Scotch son: 

= 0.945 

Despues de coiregir los grados de libertad, se obtiene R 2 de 94.5%. 

Como puede esperarse, la mayoria de los programas de computation tambien informan el coeficiente de 
determinacion corregida. La pantalla 12. 1 revela R - s q (adj) = 94.5%. 


D. Evaluation del modelo como un todo 


Dado el modelo de regresion, una de las primeras preguntas que se plantean es: “^Tiene algun valor explicativo?” 
Esto puede responderse mejor realizando el analisis de varianza (ANOVA). El procedimiento del ANOVA prueba 
si alguna de las variables independientes tiene una relacion con la variable dependiente. Si una variable 
independiente no esta relacionada con la variable L, su coeficiente deberia ser cero. Es decir, si X. no esta 
relacionada con Y , entonces p. = 0. El procedimiento ANOVA prueba la hipotesis nula de que todos los valores P 
son cero contra la altemativa de que por lo menos un p no es cero. Es decir 


^A=A=A=-=A=o 

H a \ A1 menos un fi no es cero 

Si no se rechaza la hipotesis nula, entonces no hay relacion lineal entre Y y cualquiera de las variables 
independientes. Por otra parte, si la hipotesis nula se rechaza, entonces por lo menos una variable independiente 
esta relacionada linealmente con Y. 

El proceso ANOVA, necesario para probar la hipotesis nula, se presento en el capitulo 10. Se establece una 
tabla ANOVA y se utiliza la prueba F. La tabla 1 2.2 proporciona el formato general para una tabla ANOVA para la 
regresion multiple. 


Tabla 12.2 

Una tabla ANOVA 
generalizada 


Fuente de variacion 

Suma 

de cuadrados 

Grados 
de libertad 

Cuadrado 

medio 

Valor F 

Entre muestras (tratamiento) 

SCR 

K 

SCR 

K 

r CMR 
CME 

Dentro de las muestras (error) 

SCE 

n-k- 1 

SCE 
n-k - 1 


Variacion total 

SCT 

n - 1 




Vale la pena destacar la similitud de la tabla 12.2 a las tablas ANOVA que ya se han visto. El grado de libertad 
para la suma de los cuadrados de la regresion es igual a k, el numero de variables independientes del modelo, 
mientras que el grado de libertad para la suma de cuadrados del error es n - k - 1 . Cada una de las sumas de 
cuadrados se encuentra exactamente igual que en la regresion simple. 


SCT = l(Yj ~ Y) 2 


[ 12 . 9 ] 
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SCR = 2(K - Y) 2 

[12.10] 


SCT = S(F, - Y;) 2 

[12.11] 


La tabla 12.3 proporciona los resultados en una tabla ANOVA para Hop Scotch Airlines. Esta information 
tambien puede observarse en la pantalla 12. 1 (presentada anteriormente) y en la pantalla 12.3 (repetida nuevamente 
por conveniencia). 


Tabla 12.3 

Fuente de variation 

Suma 

Grados 

Cuadrado 

Valor F 

Tabla ANOVA para 


de cuadrados 

de libertad 

medio 


Entre muestras (tratamiento) 

163.632 

2 

81.816 

121.18 

Hop Scotch 


Dentro de las muestras (error) 

8.102 

12 

0.675 



Variation total 

171733 

14 




Pantalla 12.3 

Analysis of variance (Analisis de varianza) 


SOURCE 

DF 

SS 

MS 

F 

P 



Regression 

2 

163.632 

81.816 

121.18 

0.000 



Error 

12 

8.102 

0.675 





Total 

14 

171.733 




DF 

= Grados de libertad 







SS 

m Suma de cuadrados 

SOURCE 

DF 

SEQ SS 




MS 

= Cuadrado medio 

ADV 

1 

161.044 




ADV 

= Publicidad 

NI 

1 

2.588 




NI 

= Ingreso nacional 


Debido a que la razon F es CMR/CME , los grados de libertad necesarios para realizar una prueba F vista en la 
tabla 12.3 son 2 y 12. Para probar la hipotesis, al nivel del 5%, se tiene de la tabla G (apendice III) que F 005 2 12 es 
3.89. La regia de decision es: no rechazar si F<3.89; rechazar si F>3.89. Esto se muestra en la figura 12.3. debido 
a que F = 121. 1 8 > 3.89, la hipotesis nula se rechaza. Se puede concluir al nivel del 5% que existe una relation lineal 
entre Y y por lo menos una de las variables independientes. 


Figura 12.3 

Prueba Fpara el modelo 
de regresion de Hop 
Scotch 



121.18 
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E. Pruebas individuates para los coeficientes de regresion parcial 

El siguiente paso logico es probar cada coeficiente individualmente para determinar cual es (cuales son) 
significante(s). Primero se prueba la publicidad. El proceso es identico a la regresion simple: 

Ho- Pi =0 

Ha-Pi* 0 

en donde Pj es el coeficiente de regresion poblacional para la publicidad. No rechazar la hipotesis nula significa 
que la publicidad no contribuye con poder explicativo alguno al modelo, dado que el ingreso nacional ya esta 
incluido. 

Se utiliza la prueba t estandar con n - k - 1 grados de libertad. 


Prueba de hipotesis para 

b. - p. 


la significancia del coeficiente 

S h 

[12.12] 

de regresion parcial 




en donde s bl es el error estandar del coeficiente de regresion. De la misma manera que con la mayorfa de estadisticos 
relacionados con la regresion multiple, s bl es diffcil de calcular manualmente. Por fortuna, la mayoria de los 
paquetes para computador reportan esta informacion. Como se observa en la impresion de Minitab en la pantalla 
12.4, el valor t para la publicidad es 


0.8398 - 0 
0.1419 


5.92 


Pantalla 12.4 


Regression Analysis 

(Analisis 

de regresion) 



The regression equation is (La 

ecuacion de regresion es) 

Stdev 

= Desviacion 

PASS =3.53 

+ 0.840 

ADV +1.44 

NI 


estandar 





t-ratio 

= razon t 

Predictor 

Coef 

Stdev 

t-ratio p 

PASS 

= Pasajeros 

Constant 

3.5284 

0.9994 

3.53 0.004 



ADV 

0.8397 

0.1419 

5.92 0.000 



NI 

1.4410 

0.7360 

1.96 0.074 




Si se selecciona un valor a del 1%, t . 01 J2 = 3.055. Como se observa en la figura 12.4, 

Regia de decision: “No rechazar si t esta entre ± 3.055. De lo contrario rechazar”. 

Debido a que t = 5.92 > 3.055, se rechaza la hipotesis nula. Al nivel de significancia del 1%, la publicidad 
contribuye significativamente al poder explicativo del modelo, aun despues de haber incluido el ingreso nacional. 
Esto se confirma mediante el valor p en la pantalla 1 2.4 de 0.000. El valor p, es el valor a mas bajo en el que se puede 
fijar y sin embargo rechazar la hipotesis nula. Debido a que el valor a del 1% es mayor que 0.000 se rechaza la 
hipotesis nula. 
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Figura 12.4 

Prueba 

de significancia 
para publicidad 



Vale la pena recordar del capftulo 1 1 que cuando la publicidad era la unica variable explicativa se reporto un 
valor t de 13.995. ^Por que es diferente ahora? El valor t de 5.92 en este modelo mide la contribution adicional de 
publicidad dado que el ingreso nacional ya esta incluido. A1 rechazar la hipotesis nula, se ha determinado al nivel 
de significancia del 1% que la publicidad contribuye significativamente al poder explicativo del modelo, incluso 
despues que se ha adicionado el ingreso nacional. 

La misma prueba de significancia se realiza sobre la segunda variable explicativa, el ingreso nacional. 

H 0 : (i 2 = 0 
H a : P 2 *0 


La pantalla 12.4 revela que: 


1.441 - 0 
0.7360 


1.96 


Si a = 5%, f p = 2.179. Entonces, como lomuestra la figura 12.5, 

Regia de decision: “No rechazar si t esta entre ± 2. 179. De lo contrario rechazar”. 


Figura 12.5 

Pruebas 

de significancia 
para el ingreso 
nacional 


Con a = 0.05, el valor t 

1.96 esta en la zona de no / \ 

rechazo, sugiriendo que el / 1 

ingreso nacional no es / i 

significante. / i 

\ a = 0.05 

0.025 /^ 

L_ 

\ s O025 


-2.179 

0 

1.96 2.179 

i i 

! 

Zona 

J 

de 

no rechazo I 

Con a - 0.10, el valor t de 


i 

1.96 cae en la zona de 

/T\ 

| a = 0.10 

rechazo, sugiriendo que el / 

i \ 

i 

v ; 

ingreso nacional es / 

i 

\ 

significante. / 

i 

i 

i 


_^^0.05 ] 

i 

i 

i 

i 

| 0.0^-^. 

-1.782 

0 

1.782 1.96 

L_ 

Zona 



de no rechazo 
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Claramente, la hipotesis nula P 2 = 0 no se rechaza. No se puede concluir, al nivel de significance del 5%, que 
el ingreso nacional contribuye al poder explicativo del modelo si la publicidad ya esta incluida como variable 
explicativa. 

De acuerdo con el valor p, se puede bajar el nivel de significancia a solo 7.4% y sin embargo rechazar la 
hipotesis nula. Si el valor a se fija mas bajo que 7.4%, tal como 5%, no se rechaza la hipotesis nula. Pero si a se fija 
al 10%, f 0 . ]0J2 = ± 1.782, 

Regia de decision: “No rechazar si t esta entre ± 1.782. De lo contrario rechazar”. 

Debido a que el valor t es 1 .96, la hipotesis nula se rechaza al nivel de significancia del 10%. Esto tambien se refleja 
en lafigura 12.5. 


Ejercicios de la section 


1. Dado el modelo de regresion Y = 40 + 3X { - 4X 2 , 

a. Interprete los coeficientes 

b. Estime FsiX, = 5 y X 2 = 10. 

2 . Dada la ecuacion de regresion, con valores t en parentesis, 

Y = 100 + 17X, + 80X 2 
(0.73) (6.21) 

^Como podrfa usted mejorar este modelo? 

3. Para la ecuacion 

Y = 100 - 20Xj - 40X 2 

a. - Cual es el impacto estimado de X { sobre Y7 

b. ^,Que condiciones respecto a X 2 deben observarse al responder la parte al 

4 . Una funcion de demanda se expresa como 

Q = 10 + 12P + 8/ 

en donde Q es la cantidad demandada, P es el precio, e / es el ingreso del consumidor. ^Como responderia a 
esta ecuacion? 

5. Un modelo de regresion con n = 20 observaciones y tres variables independientes reporta un valor F de 3.89. 
^Alguna de las variables independientes es significante al nivel del 1%? 

6. Se presenta una regresion de consumo sobre el ingreso y la riqueza, con valores t en parentesis. ^Las 
variables independientes son significantes al nivel del 5%? Eran 100 observaciones. 

C - 52 + 17.3/ + 4.6 W 
(12.2) (0.87) 

Un modelo de regresion del consumo (Q sobre el ingreso (I) y la riqueza (W) produjo los siguientes resultados: 

R 2 - 0.86 
R 2 = 0.79 
F = 17.42 

C = 402 + 0.83/ + 0.7 1W 
(0.71) (6.21) (5.47) 


7 . 
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en donde los valores t se muestran en parentesis. Eran 25 observaciones en el conjunto de datos. 

a. ^Cual es el significado del termino intercepto? 

b. ^Los coeficientes son significantes al nivel del 5%? 

c. <[E1 modelo es significante al nivel del 10 %? 

8. Batex Associates vende aceite de calefaccion a los residentes de las areas rurales de Virginia. El director del 
departamento de mercadeo en Batex desarrollo un modelo de regresion del consumo de aceite de calefaccion 
(en galones) de sus clientes sobre la temperatura local (TEMP), la poblacion (POP) por condados, y el precio 
del aceite. Los resultados estan dados en la siguiente impresion en Minitab. 

a. ^Cual es el modelo? 

b. ^Los datos sugieren que las tres variables son significantes al nivel del 5%? 

c. ^Cual es el nivel de significancia mas bajo para cada variable? 

d. ^Como sugerirfa usted mejorar el modelo? 

e. ^Que tan fuerte es la relacion? 


The regression equation 

is 



OIL 

= Aceite 

OIL =20.7 

- 0.853 TEMP 

+ 0.113 

POP + 0.00193 PRICE 

POP 

= Poblacion 






t-ratio 

= razon t 

Predictor 

Coef 

Stedv 

t-ratio 

P 

Stdev 

= Desviacion 

Constant 

20.706 

3.455 

5.99 

0.000 


estandar 

TEMP 

-0.8530 

0.6220 

-1.37 

0.085 

R-sq 

= r 2 

POP 

0.11287 

0.02603 

4.34 

0.000 



PRICE 

0.001929 0 

.003570 

0.54 

0.595 



s - 1.478 

R-sq = 95.8% 

R-sq 

(adj) = 95. 

.2% 




9 . Un campo de la economia denominado capital humano con frecuencia sostiene que el ingreso de una persona 
(7) podrfa determinarse sobre la base de su 1) nivel de educacion (£), 2) capacitacion (7), y 3) nivel general de 
salud (77). Utilizando 25 empleados en una pequena empresa textil en Carolina del Norte, un investigador hizo 
regresion de ingreso sobre las otras tres variables y obtuvo los siguientes resultados: 

/ = 27.2 + 3.7£ +1.7 T + 3.05/7 
(3.70) (6.21) (4.32) (6.79) 

R 2 - 0.67 F = 5.97 

7 se mide en unidades de 1,000 dolares, E y T se miden en anos, y 77 se mide en terminos de un fndice escalado 
de la salud propia: 

a. Si la educacion propia incrementa en dos anos, £ que pasa con su ingreso? 

b. i El modelo es significante al nivel del 5%? Plantee la hipotesis, la regia de decisidn, y la conclusion. 

c. Determine cual(es) variable(s) es(son) significante(s) al nivel del 10%. Plantee la hipotesis, la regia de 
decision y la conclusion. 

d. ^Cual es el valor del coeficiente de determination coiregido? 

10 . lQu6 significa si la hipotesis nula en una prueba para una p. no se rechaza? 

11 . En referencia al problema anterior si 77 0 : p. no se rechaza, segun el modelo, i que pasara a Y si X cambia en una 
unidad? ^En dos unidades? 



CAPITULO 12 • Regresion multiple y correlacion 389 


12. Considerando el siguiente modelo con n = 30. 

Y = 50 + 10X ] + 80X> 

R 2 = 0.78 S hi = 2.73 = 4.71 

^Que variable(s) es (son) significantes al nivel del 5%? Plantee la hipotesis, la regia de decision y saque una 
conclusion. 

13. Los economistas han sostenido durante mucho tiempo que la demanda de dinero por una comunidad se ve 
afectada por 1) el nivel de ingreso y 2) la tasa de interes. A medida que el ingreso aumenta, las personas 
desean guardar mas dinero para facilitar el incremento en sus transacciones diarias. A medida que la tasa de 
interes aumenta, las personas deciden mantener menos dinero debido a la oportunidad de invertirlo a una 
tasa de interes mas elevada. 

Un economista del gobiemo federal hace regresion de la demanda de dinero (M) el ingreso (/) y las tasas 
de interes (r), en donde M se expresa en cientos de dolares e / en miles de dolares. El modelo es: 

M = 0.44 + 5.49/ + 6.4r 

Una tabla parcial ANOVA es 


Fuente 

Suma 

Grados 


de cuadrados 

de libertad 

Entre muestras 

93.59 

2 

Dentro de muestras 

1.42 

9 


a. De acuerdo con la teorfa de demanda de dinero, ^los signos de los coeficientes son como se esperaban? 

Explique. 

b . Pruebe todo el modelo a a = 0.01 . 

14. Dadas las condiciones del ejercicio 13, si el error estandar del coeficiente para I es 1.37 y el de r es 43.6, 
determine cual variable es (o cuales variables son) significante al nivel del 1%. Plantee la hipotesis, la regia de 
decision y la conclusion. 

15. Un analista economico de IBM desea pronosticar las ventas regionales (5) en cientos de dolares con base en 
el numero de personal de ventas (P), el niimero de nuevos negocios que comienzan en la region (P), y alguna 
medida de los precios. Como representante de la ultima variable, el analista utiliza los cambios en el Indice de 
precios al consumidor (IPC). Luego recolecta datos para las 10 regiones de ventas y deriva el siguiente 
modelo y tabla ANOVA parcial: 


S = “1.01 

+ 0.422P + 0.09 IP - 

1.8 IPC 

Fuente 

Suma 

Grados 


de cuadrados 

de libertad 

Entre muestras 

391.57 

3 

Dentro de muestras 

31.33 

6 


a. Pruebe la significancia de todo el modelo al 1%. Plantee la hipotesis, la regia de decision y la conclusion. 

b. Si los errores estandar de los coeficientes de P, P, y IPC son 0.298, 0.138 y 2.15, respectivamente, pruebe 
cada coeficiente al nivel del 10%. Plantee la hipotesis, la regia de decision y la conclusion en cada caso. 

c . ^Como puede usted conciliar los hallazgos de las partes ay bl 
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12.4 Presencia de multicolinealidad 

Anteriormente se expreso el peligro de la multicolinealidad. Este problema surge cuando una de las variables 
independientes esta relacionada linealmente con una o mas de las otras variables independientes. Dicha situation 
contraviene una de las condiciones de la regresion multiple. Especificamente, la multicolinealidad ocurre si existe 
una alta correlacion entre dos variables independientes, X, y X.. En el capitulo 11 se discutio el coeficiente de 
correlacion r para la variable dependiente y una sola variable independiente. Si este mismo concepto se aplica a 
dos variables independientes, X. y X., en regresion multiple, se puede calcular el coeficiente de correlacion r . Si r. 
es alto, existe multicolinealidad. 

^Quc es alto? Desafortunadamente, no existe respuesta a esta pregunta critica. No existe un punto de corte 
magico en el cual se pueda determinar que la correlacion es demasiado alta y por ende existe multicolinealidad. La 
multicolinealidad es un problema de grado. En cualquier momento dos o mas variables independientes estan 
relacionadas linealmente, entonces existe algun grado de multicolinealidad. Si la presencia se vuelve demasiado 
pronunciada, el modelo se ve afectado negativamente. Lo que se considera demasiado alto todavia es un llamado 
al juicio por parte del investigador. Es necesario algun discemimiento para hacer que dicho llamado se proporcione 
en esta section. 

Se asume que se estan utilizando las tecnicas de regresion para estimar una curva de demanda (o funcion de 
demanda) para su producto. Al reconocer que el numero de consumidores esta relacionado con la demanda, se 
seleccionan como variables explicativas. 

Xj = Todos los hombres en el area del mercado 
X 2 = Todas las mujeres en el area del mercado 
X 3 = Poblacion total en el area del mercado 

Obviamente, X 3 es una combination lineal de X } y X 2 (X ? = X ] + X 2 ). La correlacion r /3 entre X x y X 3 y la correlacion 
r 23 entre X 2 y X 3 es muy alta. Esto garantiza la presencia de la multicolinealidad y crea muchos problemas en el uso 
de las tecnicas de regresion. A continuation se presenta una discusion sobre algunos de los problemas mas 
comunes. 


A. Los problemas de la multicolinealidad 

Uno de los problemas mas preocupantes de la multicolinealidad surge de la incapacidad de separar los efectos 
individuales de cada variable independiente sobre F. Ante la presencia de la multicolinealidad, es imposible 
desenmaranar los efectos de cada X . Se supone en el modelo 

Y = 40 + 1 OX , + 80X 2 

X, y X 2 mostraron un alto grado de correlacion. En este caso, el coeficiente de 10 para X ] puede no representar el 
efecto verdadero de X { sobre F. Los coeficientes de regresion se vuelven no confiables y no pueden tomarse como 
estimaciones del cambio en Y dado un cambio de una unidad en la variable independiente. 

Ademas, los errores estandar de los coeficientes, s h{ , se desbordan. Si se toman dos o mas muestras del mismo 
tamano, se encontrana una gran variation en los coeficientes. En el modelo especificado anteriormente, en lugar 
de 10 como coeficiente de X [5 una segunda muestra puede dar un coeficiente de 15 o 20. Si b { varfa mucho de una 
muestra a la siguiente, se debe cuestionar la exactitud. 

La multicolinealidad incluso puede hacer que el signo del coeficiente sea opuesto al que la logica dicta. Por 
ejemplo, si se incluye el precio como una variable en la estimation de la curva de demanda, se puede encontrar que 
tomo un signo positivo. Esto implica que como el precio de un bien sube, los consumidores compran mas de este. 
Esta es una evidente contravention de la logica que esta tras la teona de la demanda. 
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B. Deteccion de la multicolinealidad 

Quizas la forma mas directa para probar la multicolinealidad es producir una matriz de correlacion para todas las 
variables del modelo, como lo muestra la impresion en Minitab en la pantalla 12.5. El valor de 0.870 para la 
correlacion entre las dos variables independientes indica que NI y ADV estan relacionadas muy de cerca. Aunque 
no existe un valor predeterminado para r que senale la aparicion de la multicolinealidad, es muy probable que un 
valor de 0.870 lo suficientemente alto indique un problema importante. 


Pantalla 12.5 

Correlations 

(Correlaciones) (Pearson) 


ADV 

PASS 

PASS = Pasajeros 

PASS 0.968 


ADV = Publicidad 

NI 0.870 

0.903 

NI = Ingreso nacional 


Puede eliminarse algo de conjetura utilizando una prueba t para determinar si el nivel de correlacion entre dos 
variables independientes difiere significativamente de cero. Dada una relacion de no cero entre publicidad e 
ingreso nacional de r = 0.870 en la muestra, se desea probar la hipotesis de que la correlacion es cero al nivel 
poblacional. Se probara la hipotesis de que: 

M 0 : P\2 ~ 0 
H a : p n * 0 

en donde p 12 es el coeficiente de correlacion poblacional para X (ADV) y X 2 (NI). Se puede hacer esto utilizando 
las tecnicas del capitulo 11. Alii se demostro que: 



en donde r n es la correlacion muestral entre publicidad (Xj) e ingreso nacional (X 2 ) y 



Como ilustracion, la hipotesis de que p 12 = 0, en donde p ]2 es el coeficiente de correlacion poblacional para las dos 
variables independientes, se realiza asf: 


5 = 


/I ~ (0.87) 2 
V 15-2 

0.1367 


Por tanto, 

= 0.870 
1 ~ 0.1367 
= 6.36 


Si se determina a al 5%, el valor critico de 1 005 13 = 2.16. Hay n - 2 (no n-k- 1) grados de libertad. 


Regia de decision: “No rechazar si - 2.16 < t < 2. 1 6. Rechazar si t <-2.26 o > 2.16”. 
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Debido a que t = 6.36>2.16, se puede rechazar la hipotesis nula de que no hay correlacion entre X ] y X 2 (p ]2 = 0). 
Existe alguna multicolinealidad. Esto no significa que el modelo es defectuoso irrevocablemente. De hecho, muy 
pocos raodelos estan totalmente libres de multicolinealidad. Como manejar este problema sera un tema que se 
discutira en breve. 

Otra forma de detectar la multicolinealidad es comparar los coefieientes de determinacion entre la variable 
dependiente y cada una de las variables independientes. De la pantalla 12.5 se encuentra correlacion entre 
pasajeros y publicidad que es r 2 = (0.968) 2 = 0.937, mientras que entre pasajeros e ingreso nacional es r 2 = (0.903) 2 
= 0.815. Sin embargo las dos variables juntas revelaron un R 2 de solo 0.953. Si se toman independientemente, las 
dos variables independientes explican el 93.7% y el 81.5%. Aparentemente existe alguna superposition en su 
poder explicativo. Incluir la segunda variable de NI hizo muy poco por incrementar la capacidad del modelo para 
explicar el numero de pasajeros. Gran parte de la information sobre pasajeros, ya proporcionada por la publicidad, 
simplemente se duplica por el NI. Este es un indicio de que la multicolinealidad puede estar presente. 

Una tercera forma de detectar la multicolinealidad es analizar el factor de inflation de varianza (FTV). El FIV 
relacionado con toda variable X se halla haciendo regresion de esta sobre todas las otras variables X. El R 2 
resultante se utiliza luego para calcular el FIV de esa variable. EL FIV para todo X. representa la influencia de dicha 
variable en la multicolinealidad. 


Factor de inflation de la varianza El FIV para toda variable independiente es una 
medida del grado de multicolinealidad en que contribuye dicha variable. 


Debido a que hay solo dos variables independientes en el modelo de Hop Scotch, se hace regresion de X } 
sobre las otras variables independientes (X 2 ), o se hace regresion de X 2 sobre las otras variables independientes 
(X,) y da el mismo coeficiente de correlacion (r 12 = 0.87), como se muestra en la pantalla 12.5. El FIV para cualquier 
variable independiente dada X. es: 


Factor de inflation de 
la varianza para X 


- -rh 


[12.13] 


en donde R 2 es el coeficiente de determinacion obtenido al hacer la regresion de X sobre todas las otras variables 
independientes. Como se anoto anteriormente, la multicolinealidad produce un incremento en la variation, o error 
estandar, del coeficiente de regresion. El FIV mide el incremento en la varianza del coeficiente de regresion por 
encima del que ocurrirfa si no estuviera presente la multicolinealidad. 

El FTV para publicidad es: 


FIViX,) 


l_ 

1 - (0.87 ) 2 


= 4.1 


El mismo FIV para X 2 se hallarfa ya que hay solo dos variables independientes. Esto podria interpretarse como 
la varianza en b } y T? 7 que es mas de cuatro veces lo que deberfa ser sin la multicolinealidad en el modelo. Sin 
embargo, en general, la multicolinealidad no se considera un problema significativo a menos que el FIV de una 
sola X. mida por lo menos 10, o la suma de los FIV’s para todas las X. sea de por lo menos 10. Claro que los 
paquetes de computation proporcionaran el FIV, tal como se muestra en la impresion de Minitab de la pantalla 
12 . 6 . 
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Pantalla 12.6 


Regression Analysis (Analisis de regresion) 


The regression equation is 

PASS - 3.53 + 0.840 ADV + 1.44 NI 


Predictor 

Coef 

Stdev 

t-ratio 

P 

VIF 

Constant 

3.5284 

0.9994 

3.53 

0.004 


ADV 

0.8397 

0.1419 

5.92 

0.000 

4.1 

NI 

1.4410 

0.7360 

1.96 

0.074 

4.1 


PASS = Pasajeros 

NI = Ingreso nacional 

VIF = Factor 

de inflacion 
de la varianza 

t-ratio = razon estandar 


With only two explanatory variables, both will have the same VIF. 
(Solo con dos variables explicativas , ambas con el mismo VIF.) 


Otros indicios de multicolinealidad incluyen grandes cambios en los coeficientes o en su signo cuando existe 
un cambio pequeno en el numero de observaciones. Ademas, si la razon F es significante y los valores t no lo son, 
puede estar presente la multicolinealidad. Igualmente si la suma o eliminacion de una variable produce grandes 
cambios en los coeficientes o sus signos, puede existir la multicolinealidad. 

En resumen, ante la presencia de la multicolinealidad tenemos: 

1. Incapacidad para separar el efecto neto de las variables independientes individuals sobre Y. 

2. Un error estandar exagerado para los coeficientes b. 

3. Signos algebraicos de los coeficientes que contravienen la logica. 

4 . Una alta correlacion entre variables independientes, y un FIV elevado. 

5. Grandes cambios en los coeficientes o sus signos, si el numero de observaciones se cambia en una sola 
observacion. 

6. Una razon F significativa combinada con razones t no significativas. 

7. Grandes cambios en los coeficientes o en sus signos cuando se adiciona o se quita una variable. 


C. Corrigiendo la multicolinealidad 

^Que puede hacerse para eliminar o mitigar la influencia de la multicolinealidad? Quiza la solution mas logica es la 
eliminacion de la variable causante. Si X. y X estan relacionadas muy de cerca, una de ellas puede sencillamente 
eliminar se del modelo. Despues de todo, debido a la superposition, la inclusion de la segunda variable agrega 
muy poco a la explication de Y. 

La pregunta serfa ^cual de ellas deberia eliminarse? Haciendo referenda al modelo de Hop Scotch, puede ser 
aconsejable eliminar NI debido a que su correlacion con Y es menor que la de publicidad. Las pruebas t practicadas 
tambien sugieren que NI no era significante al nivel del 5%. 

Sin embargo, al eliminar simplemente una de las variables esto puede conllevar al sesgo de especificacion, en 
el cual el formato del modelo esta en desacuerdo con su base teorica. Debe evitarse la multicolinealidad, por 
ejemplo, si el ingreso se eliminara de una expresion funcional para la demanda de los consumidores. Sin embargo, 
la teorfa economica, asf como el simple sentido comun, dicen que el ingreso deberia incluirse en todo intento por 
explicar el consumo. 
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Sesgo de especificacion Una especificacion erronea de un modelo a causa de la 
inclusion o exclusion de ciertas variables que terminan en una contravencion de los 
principios teoricos, esto es lo que se denomina sesgo de especificacion. 


Si se prohfbe eliminar una variable debido a algun sesgo resultante, se puede con frecuencia reducir la 
multicolinealidad cambiando la forma de la variable. Quiza dividiendo los valores originates de la variable causante 
por la poblacion, para asi obtener una cifra per capita lo cual serfa benefico. Adicionalmente, dividir ciertas 
medidas monetarias por el indice de precios (como el Indice de Precios al Consumidor) y por ende obtener una 
medida en terminos “reales”, tambien es un metodo efectivo de eliminar la multicolinealidad. Ambos procedimientos 
podrian aplicarse al NI. 

Tambien es posible combinar dos o mas variables. Esto podrfa hacerse con el modelo para la demanda del 
consumidor, el cual empleo X x = hombres, X, = mujeres, yl 3 = poblacion total. Las variables X, y X 2 podrian 
sumarse para formar X y El modelo entonces constaria de una sola variable explicativa. 

En cualquier evento, deberfa reconocerse que existe algun grado de multicolinealidad en la mayoria de los 
modelos de regresion que contienen dos o mas variables independientes. Entre mas grande sea el numero de 
variables independientes mayor sera la probabilidad de multicolinealidad. Sin embargo, esto no necesariamente 
resta meritos a la utilidad del modelo ya que el problema de multicolinealidad puede no ser grave. La multicolinealidad 
causara grandes errores en los coeficientes individuates, aunque el efecto combinado de estos coeficientes no 
sea drasticamente alterado. Un modelo de prediction disenado para predecir el valor de Y, con base en todos los 
X tornados en combination, daran una precision considerable. Solo los modelos explicativos creados para explicar 
la contribution al valor de Y por cada X , tienden a colapsarse ante la multicolinealidad. 


Ejercicios de la seccion 


16. Defina la multicolinealidad. Explique claramente todos los problemas que puede producir un modelo de 
regresion. 

17. ^Por que la multicolinealidad incrementa la probabilidad de un error Tipo II al probar una hipotesis sobre un 
coeficiente de regresion? 

18. Describa las pruebas que pueden utilizarse para detectar la multicolinealidad. 

19. ^Como se calcula un factor de inflation de varianza? ^Que mide exactamente? 

20. Un economista de la Federal Research Board propuso estimar el promedio industrial del Dow Jones utilizando 
como variables explicativas X j? tasa de interes sobre los bonos corporativos AAA; X 2 tasas de interes sobre 
los valores de la Tesoreria de Estados Unidos. Se pide su consejo. ^Como responderfa usted y que problema 
estadistico es probable que encuentre? 


12.5 Comparacion de los coeficientes de regresion 

Despues de desarrollar el modelo completo, existe con frecuencia la tendencia a comparar los coeficientes de 
regresion para determinar cual variable ejerce mas influencia en Y. Esta tentacion peligrosa debe evitarse. Para el 
modelo: 


Y = 40 + 10X, + 200X 2 
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en donde Y es toneladas de production, X x unidades del insumo de trabajo, y X 2 es unidades de ingreso de capital, 
se puede concluir que el capital es mas importante que el trabajo al determinar la production, ya que tiene el 
coeficiente mas grande. Despues de todo, un incremento de una unidad de capital, manteniendo constante el 
trabajo, resulta en un incremento de 200 unidades en la production. Sin embargo, tal comparacion no es posible. 
Todas las variables se miden en unidades totalmente diferentes: una en unidades de peso, otra en numero de 
personas y una tercera en maquinas. 

Al medir todas las variables de la misma manera esto nos permite juzgar el impacto relativo de las variables 
independientes con base en el tamano de sus coeficientes. Se supone que se plantea un modelo en terminos de 
unidades monetarias, como: 


Y = 50 + 10,000X, + 20X 2 

en donde Y esta en dolares, X { en unidades de US$1,000, y X 2 esta en centavos. A pesar del gran coeficiente para 
X ]y no es posible concluir que es de mayor impacto. Un incremento de US$1,000 (1 unidad) enX | incrementa Y en 
10,000 unidades. Un incremento de US$1,000 (100,000 unidades) en X 2 incrementara Y en 2,000,000 unidades 
(100,000x 20). 

Incluso si se expresa Y, X }i yX 2 en unidades de US$1, no se puede comparar el impacto relativo de X } y X 2 en 
los cambios en Y . Factores diferentes al coeficiente de una variable determinan su impacto total en Y. Por ejemplo, 
la varianza en una variable es muy importante al determinar su influencia en Y. La varianza mide con que frecuencia 
y cuanto cambia una variable. Por tanto, una variable puede tener un coeficiente grande y cada vez que cambia 
afecta a Y notablemente. Pero si su varianza es muy pequena y cambia solo una vez en un milenio, su impacto 
global en Y sera insignificante. 

Para compensar estas deficiencias, algunas veces se mide la respuesta de Y a los cambios en los coeficientes 
de regresion estandarizados. Los coeficientes de regresion estandar, tambien denominados coeficientes beta (no 
confundir con el valor p, el cual es el coeficiente desconocido a nivel poblacional), reflejan el cambio en la 
respuesta promedio de 7, calculada en el numero de desviaciones estandar de F, de los cambios en X., medida en 
el numero de desviaciones estandar de X., El efecto que se pretende con el calculo de los valores p es hacer que 
los coeficientes «no tengan dimensiones”. 

El valor P para una variable explicativa X. se calcula asi: 


Coeficiente beta o 
estandarizado para X. 


Beta = 


v / S y 


[ 12 . 14 ] 


en donde s v y s xj son desviaciones estandar de la variable dependiente Y y la variable independiente X 
respectivamente. Dado que estos valores son 3.502 para la variable dependiente pasajeros, y 0.605 para el ingreso 
national en este ejemplo, el valor p para el ingreso national se convierte: 


Beta = 


1.441 

3.502/0.605 


0.2436 


Asi, un cambio en una desviacion estandar en el ingreso nacional da un cambio en la desviacion estandar de 
pasajeros en 0.2436. De igual forma, p para publicidad es 0.7519. Esto puede sugerir que la publicidad tiene un 
impacto mas fuerte en los pasajeros. Sin embargo, ante la presencia de la multicolinealidad, incluso estos coeficientes 
estandarizados sufren de muchas de las deficiencias que los coeficientes normales. Por ende, se considera una 
practica deficiente medir la importancia de una variable con base en su coeficiente p. 
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12.6 Regresion paso a paso 

Muchos paquetes modemos de computation proporcionan un procedimiento que ofrecen al estadistico la option 
de permitir que el computador seleccione las variables independientes deseadas, de una lista de posibilidades 
establecida previamente. El estadistico proporciona los datos para varias variables explicativas potenciales y, 
luego, con ciertos comandos, da la orden al computador para que determine cuales de las variables son las mas 
adecuadas para formular el modelo completo. 

De esta forma, el modelo de regresion se desarrolla por etapas; esto es lo que se conoce como regresion paso 
a paso. Puede tomar la forma de: 1) elimination hacia atras o 2) selection hacia delante. Se analizara cada una de 
ellas. 


A. Elimination hacia atras 

Para ejecutar la elimination hacia atras, se da la orden al computador para que calcule todo el modelo utilizando 
todas las variables independientes. Los valores t luego se computan para todos los coeficientes. Si alguno es 
insignificante, el computador elimina el que tenga el valor t mas proximo a cero y calcula el modelo nuevamente. 
Esto continua hasta que todos los b. restantes sean significativamente diferentes de cero. 


B. Selection hacia delante 

Como su nombre lo indica, la selection hacia delante es el opuesto a la elimination hacia atras. Primero, la variable 
que este mas altamente correlacionada con Y se selecciona para ser incluida en el modelo. El segundo paso es la 
selection de una segunda variable con base en su capacidad para explicar 7, dado que la primera variable ya esta 
en el modelo. La selection de la segunda variable se basa en su coeficiente parcial de determination, el cual es 
una contribution de la variable al poder explicativo del modelo, dada la presencia de la primera variable. 

Por ejemplo, se asume que la primera variable seleccionada es X y Se calcula todo modelo posible de dos 
variables en el cual una de tales variables es X y El modelo que produce el R 2 mas alto es el que se selecciona. Este 
proceso continua hasta que todas las variables X estan en el modelo o hasta que la inclusion de otra variable no 
termine en un incremento significativo en R 2 . 

Aunque la regresion por pasos parece ser un metodo efectivo y conveniente para la especificacion del 
modelo, deben tomarse ciertas precauciones. El proceso explorara los datos, a la espera de un modelo 
estadfsticamente mas preciso con el R 2 mas alto. Sin embargo, un computador no puede pensar o razonar, y el 
modelo resultante puede “funcionar” estadfsticamente pero puede ser contrario a todo principio logico o teorico, 
y, por tanto, sufrir de un sesgo de especificacion. La regresion paso a paso deberia utilizarse con extrema precaution, 
y todo modelo formulado de esta forma deberia escudrinarse muy de cerca. 


12.7 Variables dummy 

En los esfuerzos de busqueda se pueden hallar muchas variables que son utiles para explicar el valor de la variable 
dependiente. Por ejemplo, anos de education, entrenamiento y experiencia son instrumentos para determinar el 
nivel de ingresos de una persona. Estas variables pueden medirse numericamente, y prestarse al an&lisis estadistico. 

Sin embargo, tal no es el caso con muchas otras variables que tambien son utiles al explicar los niveles de 
ingreso. Los estudios han demostrado que el genero y la geograffa tambien tienen un poder explicativo 
considerable. Una mujer que haya completado el mismo numero de anos de educacidn y capacitacidn que un 
hombre no obtendrd el mismo ingreso. Un trabajador del noreste puede no ganar lo mismo que un trabajador del 
sur haciendo un trabajo similar. Tanto el gtiiero como la geograffa pueden ser variables explicativas altamente 
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utiles en el esfuerzo por predecir el ingreso propio. Debido a que ninguna variable puede expresarse de inmediato 
numericamente, no pueden incluirse directamente en un modelo de regresion. Por tan to, se debe modificar la forma 
de estas variables no numericas, de tal manera que se puedan incluir en el modelo y por ende ganar el poder 
explicativo adicional que ofrecen. 

Las variables que no estan expresadas de forma directa y cuantitativa se llaman variables cualitativas o 
variables dummy. Veamos otro ejemplo, las ventas de una empresa pueden depender de la estacion. Los trajes de 
bano probablemente se venden mejor en primavera que en otono o en inviemo. Se venden mas palas para la nieve 
en diciembre que en julio. Este factor estacional puede captarse tomando en cuenta el tiempo del ano (otono, 
inviemo, primavera o verano), una variable que no puede medirse numericamente. Si una persona es casada, 
soltera o divorciada puede afectar sus gastos para efectos recreacionales, mientras que el lugar de residencia 
(urbano, suburbano, o rural) probablemente tendra impacto en la valorizacion de impuestos de una persona. En 
todos estos casos, las variables que se desean medir no se expresan numericamente. Se deben entonces utilizar 
las variables dummy para obtener una descripcion mas completa del impacto de estas medidas no numericas. 


Variable dummy La variable que da cuenta de la naturaleza cualitativa de una variable 
e incorpora su poder explicativo dentro del modelo, se denomina variable dummy. 


Como gerente regional de una cadena de tiendas por departamentos se desea estudiar la relation entre los 
gastos de los clientes y seleccionar las variables que pueden explicar tales gastos. Ademas de la selection logica 
del ingreso como variable explicativa, se considera que el sexo de un cliente tambien puede hacer parte en la 
explication de los gastos. Por tanto, se recolectan 15 observaciones para estas tres variables: los gastos en 
dolares, el ingreso en dolares y el sexo. 

Pero £como se codifican los datos para sexo en el modelo? No se puede simplemente especificar M y F para 
masculino y femenino, debido a que estas letras no pueden manipulate matematicamente. La solution se encuentra 
asignando valores de 0 o 1 a cada observacion con base en el sexo. Por ejemplo, se puede decidir registrar un 0 si 
la observacion es masculino y 1 si la observacion es femenino. Lo contrario es igualmente posible. Se podrfa 
igualmente codificar 0 si es femenino y 1 si es masculino (en breve se analizaran los efectos de este esquema de 
codification altemo). 

Se supone que se decide registrar un 0 si la observacion es masculino y un 1 si es femenino. El conjunto 
completo de datos para n = 15 observaciones aparece en la tabla 12.4 con Y en dolares y X { en unidades de 
US$1 ,000. Vale la pena notar que X 2 contiene solo valores de 0 para masculino y 1 para femenino. 


Tabla 12.4 

Datos para 
el estudio 
de los gastos 
de los clientes 


Observacion 

Gastos ( Y) 

Ingresos [X y ) 

Sexo (X 2 ) 

1 

51 

40 

1 

2 

30 

25 

0 

3 

32 

27 

0 

4 

45 

32 

1 

5 

51 

45 

1 

6 

31 

29 

0 

7 

50 

42 

1 

8 

47 

38 

1 

9 

45 

30 

0 

10 

39 

29 

1 

11 

50 

41 

1 

12 

35 

23 

1 

13 

40 

36 

0 

14 

45 

42 

0 

15 

50 

48 

0 
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Utilizando los procedimientos de MCO que se discutieron en el capitulo 1 1, la ecuacion de regresion es: 

Y = K + b,X , + b 2 X 2 
= 12.21 + 0.791X, + 5.1 1X 2 
( 0 . 000 ) ( 0 . 010 ) 


Los valores p aparecen en parentesis 

El uso de la variable dummy para sexo, en realidad produce dos rectas de regresion: una para hombres y otra 
para mujeres. Estas rectas tienen la misma pendiente pero diferentes interceptos. En otras palabras, la ecuacion da 
dos rectas de regresion paralelas que comienzan en puntos diferentes sobre el eje vertical. Debido a que se 
codified 0 para masculino, la ecuacion se vuelve: 

Y=b 0 + b l X l + b 2 X 2 
= 12.21 + 0.791X, + 5.11(0) 

= 12.21 + 0.791X, 

para hombres. Esta recta tiene un intercepto de 12.21 y una pendiente de 0.791, y se muestra en la figura 12.6. 


Figura 12.6 

Rectas de regresion 
para los gastos 



Para las mujeres, el valor codificado de 1 produce: 

Y = 12.21 + 0.791X, + 5.11(1) 

= 17.32 + 0.791X, 

Esta segunda recta tiene la misma pendiente que las rectas para hombres, pero tiene un intercepto de 17.32. 
Debido a que X 2 = 1 para mujeres, se determino que el intercepto era /? . + b, = 12.21 + 5.11 = 17.32. 

Esto significa que para cualquier nivel de ingreso dado, los clientes mujeres gastan en promedio US$5.1 1 mas 
que los hombres. Sea el ingreso igual a 30 (US$30,000). Entonces para las mujeres: 

Y = 12.21 + 0.791(30) + 5.11(1) 

= 41.05 


y para los hombres: 

Y = 12.21 + 0.791(30) + 5.11(0) 
= 35.94 


La diferencia de US$5. 1 1 ocurre porque el valor codificado de 0 para los hombres cancela el coeficiente h de 5.1 1 . 
mientras que el valor codificado de 1 para mujeres termina en la adicion de 5. 1 1 a la ecuacion. 
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Si se hubiera codificado la variable dummy asignando un 1 a una observacion masculina y un 0 a una 
observacion femenina, los resultados finales serfan iguales. Un computador demuestra que la ecuacion inicial es: 

Y = 17.32 + 0.791X, - 5. 1 1X 2 

Para las mujeres se tiene que: 

Y = 17.32 + 0.79 IX, + 5.11(0) 

= 17.32 + 0.79 IX, 

y para los hombres: 

Y = 17.32 + 0.791X, - 5.11(1) 

= 12.21 + 0.791X, 

Codificar la variable dummy de cualquier forma da los mismos resultados. 

Si se colocaran los datos en un diagrama de dispersion, pueden aparecer como en la figura 12.7. En caso 
extremo, podrfan aparecer dos diagramas casi totalmente independientes, uno para las observaciones masculinas 
y otro para las femeninas. Si se ignorara la variable dummy y se ajustara solo una recta, su pendiente serfa mucho 
mas empinada que las otras dos, como la recta identificada con Y*. El efecto atribuido solo al ingreso por la recta 
de regresion deberfa adscribirse parcialmente al sexo. 


Figura 12.7 

Diagrama de dispersion 
para los gastos 


Gastos 


Y* 



Si una variable dummy tiene mas de dos posibles respuestas, no se puede codificar como 0, 1, 2, 3 y asi 
sucesivamente. Una variable con r posibles respuestas se expandira para comprender un total de r - 1 variables. 
Por ejemplo, se puede incluir la tercera variable en el modelo para estudiar el efecto del estado civil sobre los 
gastos. Las posibles respuestas pueden incluir, casado(a), soltero(a), divorciado(a) y viudo(a). Ademas de X } 
para ingreso y X 2 para sexo, estas cuatro posibles respuestas requieren tres variables adicionales, X v X 4 y X 5 , para 
codificar los datos sobre estado civil. Esto se logra ingresando solo un 0 o un 1 por cada variable de la siguiente 
manera: 

X 3 = 1 si es casado(a) 

= 0 si no es casado(a) 

X 4 = 1 si es soltero(a) 

= 0 si no es soltero(a) 

X 5 = 1 si es divorciado(a) 

= 0 si no es divorciado(a) 

No es necesaria ninguna entrada para viudo, porque si X 3 = X 4 = X 5 = 0, el proceso de eliminacion revela la 
observacion de ser viudo. 
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Se asume que 0 esta codificado para hombres y 1 para mujeres en X r Las tres observaciones (OBS) que 
aparecen aqui para 1) un hombre casado con gastos de 30 e ingreso de 40, 2) una mujer divorciada con gastos de 
35 e ingreso de 38, y 3) un hombre viudo con gastos de 20 e ingresos de 45. 


OBS 

Y 



*3 

*4 


1 

30 

40 

0 

1 

0 

0 

2 

35 

38 

1 

0 

0 

1 

3 

20 

45 

0 

0 

0 

0 


Por ejemplo, en la primera observacion, X 2 serfa 0, ya que la observacion es hombre, y X 3 es 1, mientras que tanto 
X 4 como X 5 son 0 porque la observacion es casado. 


Ejercicios de la seccion 


21. Una empresa carbonffera desea configurar un modelo de regresion para predecir la production (F) que 
comprende como variables explicativas horas de trabajo (X^ y si ocurrio un paro durante el periodo en 
estudio ( X 2 ). Diseiie el modelo y explique. 

22 . Dado el modelo del problema anterior, i > b 2 deberfa ser positivo o negativo? Explique. 

23 . Diga que valores asignarfa usted a las variables dummy para medir la raza de una persona si las categorfas 
incluidas son 1) bianco, 2) negro, 3) asiatico y 4) otra. 

24 . Los estudiantes de la Escuela Cosmopolita de Cosmeticos ( Cosmopolitan School of Cosmetics) aprenden a 
codificar datos sobre el color del cabello como 1 si es rubio, 2 si es pelirrojo, y 3 si es de otro color. Haga 
comentarios. ^Que aconsejarfa usted? 

25 . El gerente de una empresa contable local creo un modelo de regresion para el tiempo que se toma una 
auditorfa. El modelo era 

Y = 17 - 1.4 IX, + 1.73X 2 

en donde: Y es el tiempo en horas 

X { son los anos de experiencia del auditor 

X 2 si el auditor es un CPT (Contador publico titulado) : 0 si lo es, 1 si no lo es. 

a. Interprete el coeficiente para X r 

b . ^Esperarfa usted que b 2 sea positiva? Explique 

c. iSi el auditor tiene siete anos de experiencia y es un CPT ^cuanto tiempo le tomarfa realizar la auditona? 

d. Si otro auditor tiene tambien siete anos de experiencia pero no es CPT, ^cuanto le tomarfa terminar la 
auditorfa segun el modelo? 

26 . Si la variable dummy del ejercicio 25 fuera 1 si es CPT, 0 si no es CPT, ^cual esperarfa que fuera el signo de bfl 
Explique. 

27 . Un representante de mercadeo establece una ecuacion de regresion para las unidades vendidas con base en 
la poblacion del distrito de ventas y si el distrito tiene oficina principal a la cual deba reportar. El modelo es: 

Y = 78.12 + 1.01X, - 17.2X, 

en donde Y es unidad vendida 
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X { es la poblacion en miles 

X 2 es 0 si el distrito tiene oficina, 1 si no la tiene 

a. Interprete b 2 = -17.2 

b. ^Como compararia las pendientes y los coeficientes de dos rectas de regresion suministradas por este 
modelo? Calcule y compare las dos ecuaciones de regresion. 

c. Elabore una grafica. 

28. Considerando el problema anterior, si la poblacion es 17,000 en un distrito que tiene una oficina y 17,000 en un 
distrito sin oficina, £cual serfa el numero de unidades vendidas en cada uno? Realice una grafica para ilustrar. 

29. Los estudios han demostrado que en estados con regulaciones mas liberales respecto al recibo de 
compensation por desempleo, las tasas de desempleo son mayores. Si un modelo de regresion para las tasas 
de desempleo incorpora una variable dummy, codificada con 1, si las regulaciones son liberales y con 0 si es 
de otro modo, ^el coeficiente serfa mayor que o menor que cero de acuerdo con estos estudios? Explique. 


12.8 El caso curvilineal 


A traves de la discusion se ha asumido que la relacion entre X y Y puede expresarse como una linea recta. Es decir, 
la relacion es lineal. Sin embargo, este no es siempre el caso. Se puede encontrar que un modelo curvilineal (no 
lineal) puede proporcionar un mejor ajuste. Se supone que en el esfuerzo por predecir las declaraciones de 
impuestos con base en la poblacion, Sam Jorden, alcalde de Plattsburg, recolecta los datos que se observaron en 
la tabla 12.5. Los datos, tanto para impuestos como para poblaciones, estan en millones. Un diagrama de estos 
datos se encuentra en la figura 12.8 y sugiere que el modelo curvilineal es necesario. No parece que una linea recta 
produzca un ajuste adecuado. 


Un polinomio 
de grado k 


Y = p 0 + /3 t X + (3 2 X 2 + ■■■ + i 3 k X k + £ [1 2.1 5] 


Tabla 12.5 

Impuestos 

Poblacion 

Datos del alcalde 

85 

2.68 

Jorden sobre 

118 

2.98 

impuestos 

164 

3.50 

y poblacion 

228 

3.79 

(en millones) 

31 

1.57 


43 

2.01 

61 

2.15 

611 

4.90 

316 

4.16 

444 

4.50 


Como se explico en el capitulo anterior, en un modelo de regresion simple, el cambio en Y es constante. A 
medida que cambia X, Y cambia en un monto dado. En un modelo curvilineal, a medida que X cambia, Y cambia en 
una cantidad diferente . La figura 12.8 muestra que a medida que X se incrementa, Y aumenta la tasa de incremento. 

Tales modelos curvilineales con frecuencia tienen buen ajuste utilizando una funcion polinomica de forma 
general. 
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Figura 12.8 


600 - 

Relacion curvilineal 


500 - 

para declaraciones 

c/5 

400 - 

de impuestos y poblacion 

O 

C/5 



<D 

3 

300 - 


a 

200 - 



100 - 



0 - 



Poblacion 

Se dice que la formula ( 12. 1 5) es un polinomio de grado k debido a que es la potencia mas alta de cualquier variable 
explicativa. El modelo del alcalde Jorden puede tener mejor ajuste utilizando un polinomio de grado 2, o un 
polinomio de segundo orden, como: 


Forma cuadratica 
del polinomio 


Y = b Q + b i X + b 2 X 2 


[ 12 . 16 ] 


el cual es la forma cuadratica del modelo en el cual la segunda variable explicativa es simplemente el cuadrado del 
primero. En el caso del alcalde tenemos: 


f = b 0 + b x POP + b 2 {POP) 2 


en donde T es impuestos y POP es poblacion. 

Se comparan los resultados de este modelo con los obtenidos si se estima un modelo lineal simple. La 
impresion en Minitab para el modelo simple en el cual se hace regresion de los impuestos (taxes) sobre la 
poblacion (POP) y se muestra en la pantalla 12.7. Se nota que el valor R- es un respetable 86. 1 % con R 2 del 84.3% 
y un error estandar de 76.38. Todo el modelo es 

f= -302.39 + 158.96 POP 


Pantalla 12.7 Un modelo lineal 

Regression Analysis (Analisis de regresion) 


The regression 

equation is 



Taxes 

Impuestos 

TAXES = -302 + 

159 POP 



POP 

Poblacion 





Stdev 

Desviacion 

Predictor 

Coef 

St dev 

t-ratio p 


estandar 

Constant 

-302.39 

76.75 

-3.94 0.004 

t-ratio = 

razon t 

POP 

158.96 

22.60 

7.04 0.000 



s - 76.38 

R-sq = 86.1% 

R-sq 

(adj) = 84.3% 




Si se utiliza el modelo cuadratico, como se observa en la impresion en Minitab en la pantalla 12.8, tanto R- como 
el error estandar mejoran al 98.7% y 22.20 respectivamente. El modelo se vuelve: 

t = 325.36 - 277.98PO/ 5 + 67.692(/>OP) 2 
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Obviamente, el modelo cuadratico proporciona el mejor ajuste. 


Pantalla 12.8 Un ajuste cuadratico 

Regression Analysis (Analisis de regresion) 


The regression 

TAXES = 325 - ; 

Predictor 

equation 

278 POP + 

Coef 

is 

67.7 POPSQ 

Stdev 

t-ratio 

P 

TAXES = Impuestos 

POP = Poblacion 

t-ratio = razon t 

Stdev - Desviacion 

Constant 

325.36 

70.63 

4.61 

0.000 

estandar 

POP 

-277.98 

47.10 

-5.90 

0.000 


POPSQ 

67.692 

7.226 

9.37 

0.000 


s = 22.20 

R-sq 

= 99.0% 

R-sq 

(adj) = 98.7% 



Un metodo alternative) para los modelos curvilineales puede lograrse mediante la transformacion de los datos 
de alguna manera. Un metodo comun de transformacion implica el uso de logaritmos. Esta transformacion logaritmica 
puede hacer que los datos sean lineales en el logaritmo. La tabla 12.6 muestra los datos originates del alcalde 
Jorden en las primeras dos columnas y sus logaritmos naturales en las ultimas dos columnas. Entonces el alcalde 
simplemente hace regresion del logaritmo de los impuestos sobre el logaritmo de la poblacion, como se observa 
en la impresion en Minitab en la pantalla 12.9. Se nota el mejoramiento en el error estandar de solo 0. 1680 y R 2 de 
82.2%, respectivamente. El modelo es 


Tabla 12.6 

Transformacion 

logaritmica 


LOGTX = 2.0302 + 2.6 \A%LOGPOP) 


Impuestos 

POP 

LOGTX 

LOGPOP 

85 

2.68 

4.44265 

0.98582 

118 

2.98 

4.77068 

1.09102 

164 

3.50 

5.09987 

1.25276 

228 

3.79 

5.42935 

1.33237 

31 

1.57 

3.43399 

0.45108 

43 

2.01 

3.76120 

0.69813 

61 

2.15 

4.11087 

0.76547 

611 

4.90 

6.41510 

1.58924 

316 

4.16 

5.75574 

1.42552 

444 

4.50 

6.09582 

1.50408 


LOGTX = Logaritmo de impuestos 

L0GP0P = Logaritmo de la 
poblacion 
POP = Poblacion 


Pantalla 12.9 Transformacion logaritmica 
Regression Analysis (Analisis de regresion) 

The regression equation is 
LOGTX - 2.03 + 2.61 LOGPOP 


Predictor 

Coef Stdev t- 

-ratio 

P 

Constant 

2.0302 0.1724 

11.78 

0.000 

LOGPOP 

2.6147 0.1478 

17.69 

0.000 

s - 0,1680 

R-sq = 97.5% 

R-sq 

(adj ) 
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Entonces, si la poblacion es 3.2, log POP = 1 .163 y 

logTX = 2.0302 + 2.6147(1.163) 

= 5.071 

Tomando el antilogaritmo de 5.071 da 159.33; o debido a que los datos estaban originalmente en millones, los 
recibos de impuestos del alcalde se estimarfan en US$159,330,000. 

Puede ser necesario experimental con diferentes formas funcionales para determinar cual proporciona el mejor 
ajuste. En la busqueda del modelo optimo, los resultados de diferentes modelos logaritmicos pueden compararse 
con los obtenidos utilizando funciones polinomicas. El uso de computadores hace mas practica esta comparacion. 

Sin embargo, los resultados de tales comparaciones pueden ser inconsistentes. Un modelo puede reportar un 
coeficiente de determinacion mas alto que otro (eso es bueno) mientras que lleva un error estandar de estimacion 
mayor (eso es malo). La pregunta entonces seria ^cual modelo utilizar? 

La respuesta depende, al menos en parte, del proposito para el cual esta destinado el modelo. Si se desea 
utilizar el modelo para explicar los valores presentes de Y y comprender por que se comportan como lo hacen, se 
utiliza el modelo con el coeficiente de determinacion mas alto. Es decir, si el proposito es explicar, entonces el 
modelo con el valor explicativo mas alto es el que deberia utilizarse. 

Si, por otra parte, el proposito del modelo es predecir los valores futuros de f, se utiliza el modelo con el error 
estandar de estimacion mas bajo. Si se desea predecir, se gozara de mas exito con el modelo que genera el menor 
error de prediccion. 

Sin embargo, tal experimentacion deberia mantenerse al minimo. Se considera cuestionable, incluso no etico, 
experimentar de forma salvaje con un modelo y luego con el otro. Se deberia saber desde el comienzo, dada la 
naturaleza del estudio investigativo, que procedimiento se debe seguir. Con frecuencia se hace la analogfa de que 
buscar ciegamente el mejor modelo es similar a disparar una flecha al objetivo y luego sacar el bianco del punto en 
donde cay 6 la flecha. 


Ejercicios de la seccion 


30 . Grafique los siguientes datos. Compare un modelo lineal con la forma cuadratica y proporcione una evaluation 
comparativa de cada uno. Utilizando el mejor modelo, pronostique Y si X = 22. 


Y 

X 

Y 

X 

2170 

31 

731 

18 

2312 

32 

730 

18 

2877 

36 

815 

19 

7641 

48 

1408 

25 

2929 

36 

2768 

35 



1297 

24 


31 . Utilizando los datos del ejercicio 30, realice una transformation logaritmica y pruebe los resultados de la 
regresion. ^Cuales son sus observaciones? 

32 . El alcalde Jorden desea estimar las declaraciones de impuestos con base en la formation de nuevos negocios. 
El recolecta los datos de 22 ciudades que se muestran a continuation y que el considera parecidas a la propia. 

a. Grafique el diagrama de dispersion. 

b. Compare un modelo lineal con una forma cuadratica. ^Cual parece dar el mejor ajuste? 
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c. Proyecte la declaracion de impuestos si hay 68 negocios nuevos. 


Ciudad 

Nuevos negocios 

Declaracion 
de impuestos 

Ciudad 

Nuevos negocios 

Declaracion 
de impuestos 

1 

47 

US$10,154,589 

12 

68 

US$26,272,898 

2 

51 

18,215,568 

13 

37 

6,074,615 

3 

57 

27,171,076 

14 

58 

18,215,568 

4 

68 

26,272,898 

15 

51 

13,546,448 

5 

57 

6,074,615 

16 

48 

17,500,544 

6 

45 

5,693,092 

17 

65 

14,801,029 

7 

85 

43,918,912 

18 

68 

18,215,568 

8 

87 

46,334,860 

19 

85 

43,918,912 

9 

48 

11,781,520 

20 

68 

42,738,224 

10 

57 

17,500,544 

21 

86 

45,117,748 

11 

68 

26,272,898 

22 

58 

25,391,750 


33. Utilizando los datos del ejercicio 32, calcule el modelo de regresion logarftmica. ^Como se compara con el 
desarrollado en el problema anterior? Calcule los impuestos si hay 68 nuevos negocios creados. 


Lista de formulas 


[12.1] 

[12.4] 

P “ A) 4- /3| AT) + P 2 X 2 * * ’ “P &k%k e 

Modelo de regresion multiple 

Error estandar de estimacion 

[12.5] 

R 2 -SCR 

SCT 

Coeficiente de determinacion 
multiple 

[12.8] 

[12.12] 

h, 

Coeficiente de determinacion 
multiple corregido 

Prueba t para la significancia de (3. 

[12.13] 


Factor de inflacion de la varianza 
para X. 

[12.14] 

Beta = / 

Sy/S X 

El coeficiente beta o estandarizado 
para X 

[12.15] 

Y = p 0 + p t X + p 2 X 2 + ■■■ + p k X k + c 

Un polinomio de grado k 

[12.16] 

Y = b 0 + b,X + b 2 X 2 

Forma polinomica cuadratica 
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Ejercicios del capitulo 

Nota: La mayorfa de los problemas requieren de computador. 

34 . Un director administrativo esta intentando desarrollar un sistema disenado para identificar que atributos 
personates son esenciales para avanzar gerencialmente. A quince empleados que han sido ascendidos 
recientemente se les practica una serie de pruebas para determinar (X,) sus habilidades comunicativas; (X,) la 
habilidad para relacionarse con otros y (X 3 ) la habilidad para tomar decisiones. A la clasificacion del trabajo 
de cada empleado (Y) se le hace regresion sobre estas tres variables. Los datos originales son los siguientes: 


Y 



*3 

Y 



*3 

80 

50 

72 

18 

69 

39 

73 

19 

75 

51 

74 

19 

68 

40 

71 

20 

84 

42 

79 

22 

87 

55 

80 

30 

62 

42 

71 

17 

92 

48 

83 

33 

92 

59 

85 

25 

82 

45 

80 

20 

75 

45 

73 

17 

74 

45 

75 

18 

63 

48 

75 

16 

80 

61 

75 

20 





62 

59 

70 

15 


a. Haga el modelo de regresion. Evaluelo determinando si muestra una relacion significante entre la variable 
dependiente y las tres variables independientes. 

b. iQu€ puede decirse sobre la significancia de cada X? 

35 . ^A que causa puede usted atribuir la insignificancia de X } y X 3 en el ejercicio 34? Obtenga la matriz de 
correlacion para estas variables y pruebe cada par para hallar multicolinealidad. Sea a = 5%. 

36 . Compare sus resultados del ejercicio 35 con los obtenidos con base en el FIV. 

37 . ^El director administrativo del ejercicio 36 debena utilizar este modelo para identificar las caracterfsticas que 
hicieron a un empleado elegible para ascenso? 

38 . Como un proyecto de clase, un equipo de estudiantes de mercadeo disena un modelo que explica la renta para 
la vivienda estudiantil que hay cerca de la universidad. La renta esta expresada en dolares, PC son los pies 
cuadrados que tiene el apartamento o casa, y DIST es la distancia en millas de la casa al campus. 


Renta 

PC 

DIST 

Renta 

PC 

DIST 

220 

900 

3.2 

400 

1,290 

1.5 

250 

1,100 

2.2 

450 

1,370 

0.5 

310 

1,250 

1.0 

500 

1,400 

0.5 

420 

1,300 

0.5 

550 

1,550 

0.3 

350 

1,275 

1.5 

450 

1,200 

0.5 

510 

1,500 

0.5 

320 

1,275 

1.5 


a. Realice un modelo. ^Es significante al nivel del 1%? 

b. Evalue la significancia de ambos coeficientes. 

c. ^Los signos son apropiados? Explique. 

39. Evalue el modelo del problema anterior. ^Parece util para predecir la renta? Explique. 
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40 . ^Existe evidencia de multicolinealidad en el modelo del problema anterior? ^Invalida el model o para predecir 
la renta? ^Por que si o por que no? 

41 . Del modelo desarrollado anteriormente sobre la renta estudiantil, puede usted concluir que la distancia del 
campus es una determinante mas fuerte de la renta que el numero de pies cuadrados? ^Por que si o por que no? 

42 . Si dos apartamentos tienen el mismo espacio, pero uno es dos millas mas cercano al campus, como difiere esta 
renta de la de la vivienda mas distante? 

43 . Para expandir su modelo sobre las rentas de los estudiantes, los especialistas en mercadeo del problema 
anterior disenaron un indice de lujo en el cual los estudiantes clasifican los aspectos atractivos de un 
apartamento con base en comodidades disponibles, como piscinas, cancha de tenis, servicio domestico y 
otros lujos a los cuales los estudiantes estan tradicionalmente acostumbrados. Para las 12 observaciones 
anteriores, este mdice midio 22,23, 35, 40, 32,55,36,41,51, 50, 48 y 29. Incorpore la variable a su modelo para 
explicar las rentas. Analice y explique por que usted obtuvo esos resultados. ^Su modelo es mejor con esta 
variable adicional? ^Que problema es probable que usted encuentre y que cambio harfa para corregirlo? 

44 . Haga el cambio que sugirio en el problema anterior y discuta los resultados. 

45 . En el pasado, muchos economistas han estudiado los patrones de gasto de los consumidores en la economia. 
Un estudio famoso realizado por Milton Friedman concluye que el consumo es una funcion de ingreso 
permanente , que se define como el nivel de ingreso promedio que el consumidor espera recibir en el futuro. 
La teorfa de habito-persistencia de T.M. Brown argumenta que el consumo es moldeado por el ingreso pico 
mas reciente de un consumidor-el ingreso mas alto recibido en el pasado inmediato. 

Para combinar estas dos teorfas, un economista recolecto datos sobre el consumo (CONS), ingreso permanente 
(PERM), e ingreso pico (PICO), y realizo el MCO para desarrollar un modelo. Dados estos datos, ^Como es el 
modelo? (Todos los valores estan en miles de dolares). 


Consumo 

Ingreso permanente 

Pico 

Consumo 

Ingreso permanente 

Pico 

12 

15 

17 

14 

17 

20 

22 

28 

31 

20 

25 

29 

15 

19 

21 

17 

21 

25 

17 

19 

24 

15 

19 

22 

19 

24 

27 

16 

20 

26 


a. Evalue el modelo. 

b. ^La multicolinealidad explicarfa la insignificancia del pico? Explique 

. 46 . Los datos que aparecen aqui se recolectaron para explicar los niveles salariales para los trabaj adores en una 
planta local. 


Salario (US$1,000) 

Anos de education 

Sexo 

42.2 

8 

M 

58.9 

12 

M 

98,8 

16 

M 

23.5 

6 

F 

12.5 

5 

M 

67.8 

12 

M 

51.9 

10 

F 

81.6 

14 

F 

61.0 

12 

F 
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a . Calcule el modelo de regresion utilizando un computador. 

b. ^Existe evidencia de la discrimination de sexo en cuanto a los niveles salariales? 

c. ^La education es util para explicar el salario? 

d. ^Hay problemas de autocorrelation y heterosedasticidad? 

47. Usted acaba de hacer un modelo de regresion de la retencion de un empleado (en anos) sobre la edad al 
momento de la contratacion y el genero, codificando la variable dummy de genero con 1 si es hombre y 0 si es 
mujer. Los resultados fueron 

Y = 3.2 + 0.65 EDAD - 1.3 GENERO 

a . ^Cual es la formula para hombre? ^Para mujer? 

b . Luego usted se da cuenta que usted quiso codificar 1 si era mujer y 0 si era hombre. ^Como serfa la 
ecuacion? 

c. i Ahora cual es la formula para hombre? ^Para mujer? 

d. Utilizando la formula que se vio anteriormente, ^cual es el estimado de anos de retencion si el hombre es 
contratado a los 23 anos de edad? ^Cual es utilizando su formula revisada? 


Ejercicio de computador 

Los estudios de finanzas han demostrado que el precio de una action esta directamente relacionado con el nivel 
de deuda de la empresa emisora y con la tasa de dividendos, pero esta inversamente relacionado con el numero de 
acciones en circulacion. Ingrese al archivo STOCK de su disco de datos. PRICE (precio) y la tasa de dividendo, 
DIVRATE, esta en dolares, DEBT (deuda), esta en millones de dolares y el numero de acciones en circulacion, 
OUTSTD, esta en millones de acciones. Utilizando PRICE como variable dependiente, evalue el modelo. Proporcione 
todas las interpretaciones estadfsticas pertinentes y las conclusiones. Prepare su reporte financiero final como se 
describe en el apendice I. 



Su asignacion como practicante de Griffen Associates, 
descrita en la seccion escenario a comienzos de este capitulo, 
ilustro brevemente la necesidad de analizar el desempeno 
de varios fondos mutuos competitivos. Usted debe 
desarrollar modelos que analizaran los rendimientos de tres 
anos y compararlos con los rendimientos de un ano, 
utilizando como variables explicativas las tasas de rotacion 
(el porcentaje de fondos comprados y vendidos durante 
cada periodo en cuestion), los activos totales iniciales en 
miles de millones de dolares al momento en que se abrio el 
fondo, y si el fondo tiene una carga por concepto de ventas. 


EN ESCENA 


Esta ultima variable se codifica como 1 si tiene una carga, 
y 0 si no tiene. 

Su supervisor en Griffen desea que usted prepare un 
reporte completo, incluyendo todo el analisis estadfstico 
presentado en este capitulo. Usted debe especificar los 
modelos para los rendimientos de un ano y de tres anos 
para fondos con carga o sin carga. Deben practicarse 
pruebas de multicolinealidad junto con todo el analisis 
estadfstico relevante. Utilizando los datos suministrados 
aquf, prepare su informe estadfstico como se describio en 
el apendice I. 
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Rendimiento 

de 3 anos 

Rendimiento 

de un ano 

Carga 

Transferencias 

en 3 anos 

Transferencias 

en un ano 

Activos 

5.6 

0.1 

0 

112 

58 

220.00 

4.7 

1.9 

1 

95 

62 

158.00 

4.5 

2.6 

1 

241 

65 

227.25 

4.8 

2.0 

1 

87 

61 

242.40 

5.7 

3.5 

0 

98 

57 

287.85 

4.1 

“4.3 

1 

102 

66 

207.05 

4.7 

3.2 

1 

72 

63 

237.35 

4.1 

-4.1 

1 

96 

65 

207.05 

5.2 

2.2 

0 

78 

59 

262.60 

3.7 

2.1 

1 

118 

87 

186.85 

6.2 

5.3 

0 

98 

47 

313.10 

6.6 

11.0 

0 

87 

41 

333.30 

5.2 

0.3 

0 

117 

61 

262.60 

5.5 

-2.1 

0 

87 

46 

277.75 

5.6 

4.7 

0 

85 

35 

282.80 


Del escenario a la vida real 

En el capitulo 3 del ejercicio Del escenario a la vida real, se familiarizo con algunos sitios de information sobre 
inversionistas en fondos mutuos y con Vanguard Group of Funds en especial. Aqui se analizara una informacion 
mas detallada que se reporta rutinariamente sobre los fondos y su desempeno. El analisis de la section Puesta en 
escena de este capitulo, necesito informacion sobre las cargas (costos), activos, y rendimientos de 1 y 3 anos. 
^Esta informacion se encuentra disponible en los sitios web de las empresas de fondos mutuos? Se observan 
entonces tres empresas importantes de fondos mutuos. 

En el Home Page de Vanguard Group ( www.vanguard.com ), seleccione el icono de “mutual funds” (fondos 
mutuos). Luego, haga clic en “Funds by category” (Fondos por categoria). En Growth funds (Fondos de desarrollo) 
seleccione “U.S. Growth Portfolio”. Haga clic en los rotulos de las carpetas y haga notas sobre donde obtener 
datos sobre cargas, activos y rendimientos de 1 y 3 anos. 

Haga lo mismo para Fidelity Funds ( www.fidelity.com ). En el Home Page vaya a “Fund information” (informacion 
sobre el fondo). En el area de busqueda, digite “Emerging Growth” y haga clic en “go”. Observe los datos 
disponibles. 

Repita este proceso nuevamente para Dreyfus Funds (i www.dreyjusxom ). En el Home Page, seleccione “Mutual 
Funds” (Fondos mutuos) bajo el encabezado de Products (Productos), y luego haga clic en fondos “Growth” (de 
desarrollo). Observe la informacion de Emerging Leaders Fund para buscar la disponibilidad de estos mismos 
datos. 






Plan del capi'tulo 

Este capi'tulo analiza el uso de los datos de series de tiempo o series temporales y su aplicacidn en situaciones 
comunes. Tambien se demuestra la forma como se utilizan los numeros mdice para hacer los datos de las series de 
tiempos mas comparables respecto al tiempo. 
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E S C E N A R I 0 


Durante los ultimos anos, Dickson Industries ha gozado de 
un crecimiento considerable en los ingresos por ventas y en 
las utilidades. Gran parte de este exito se debe al arduo 
trabajo realizado por Jeremy Dickson, propietario y director 
ejecutivo del negocio, asi como de su personal cercano y 
confiable. El Sr. Dickson siempre ha confiado en la 
planeacion cuidadosa con base en un analisis exhaustivo de 
las condiciones del mercado. 

Este analisis con frecuencia esta disenado para detectar 
movimientos en la acdvidad comercial y para determinar si 
la tendencia actual continuard. El Sr. Dickson tambien insist e 
en que su personal analice toda actividad ciclica en las 
fluctuaciones del negocio durante el transcurso de varios 
anos. 


Ademas, el Sr. Dickson observa todo patron detectable 
regularmente y que ocurre en momentos especfficos dentro 
del ano, o durante ciertas estaciones, respecto a la planeacion 
de sus operaciones. Ha notado ultimamente que su negocio 
es muy estacional, es decir, que sus utilidades son 
generalmente mas altas en ciertas epocas del ano. 

Sin embargo, el Sr. Dickson se da cuenta que la tendencia 
ascendente en las ventas que ha experimentado no es tan 
favorable como parece. Los cambios en el clima econdmico, 
con el tiempo, afectan los valores de sus utilidades y de los 
rendimientos por concepto de ventas. Por tanto, el reconoce 
la necesidad de establecer indices de las medidas del 
desempeno comercial para obtener una impresion mas 
exacta de qu6 tan bien va el negocio. 


Ingresos por concepto de ventas para Dickson Industries 

Modelo de tendencia lineal 
Yt * 8.375 4 * 1 .43382*/ 



• Real 
a Ajuste 

Real 

Ajuste 


MAPE: 7.31643 
MAD: L 49449 
MSD: 4.18428 


13.1 Introduction 

La importancia de poder pronosticar el futuro con algun grado de exactitud es inapreciable. ^Se imaginan los 
resultados si se pudiera observar a traves de una bola de cristal y predecir el futuro sobre el primer sabado del mes 
de mayo cuando se realizaba el Derby de Kentucky, o antes del saque del proximo campeonato de futbol? La 
proportion de exito en la prediction de los ganadores, sin duda alguna se dispararfa. 

Tal es el caso en el mundo comercial. La habilidad para proyectar eventos futures y tendencias aumenta 
enormemente la probabilidad de exito. Por tanto, no es sorprendente que los negocios gastan buena parte de 
tiempo y esfuerzo persiguiendo los pronosticos exactos de las tendencias comerciales y las evoluciones futuras. 

Numerosas herramientas cuantitativas pueden utilizarse para desarrollar proyecciones utiles. Con la ayuda de 
estas herramientas, se puede construir una bola de cristal propia y utilizarla para ver el futuro. Este caprtulo analiza 
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las formas en las cuales pueden utilizarse los datos de series de tiempo para hacer pronosticos, y como estos 
pronosticos pueden servir para tomar decisiones bien informadas. 


13.2 Series de tiempo y sus componentes 

El proceso de desarrollar un pronostico comienza con la recoleccion de datos anteriores durante varios periodos. 
El conjunto de datos resultantes se denomina una serie de tiempo o serie temporal porque contiene observaciones 
para alguna variable durante el tiempo. Los periodos de tiempo varfan en duration. Pueden ser anuales, trimestrales, 
mensuales o incluso diarios. Los periodos de solo una hora pueden utilizarse para variables altamente volatiles 
como el precio o para las acciones transadas en una de las bolsas de valores reconocidas. 


Series de tiempo Una recoleccion de datos para alguna variable 0 conjunto de 
variables durante varios periodos. 


La tabla 13.1 contiene datos de ventas trimestrales para Rampart Industries en millones de dolares, en donde por 
ejemplo, 1998-III es el tercer trimestre del ano 1998. 


lama ij.i 

Cifras de las ventas 

Perfodo 

Ventas (en millones) 

Perfodo 

Ventas (en millones) 

1995-IV 

31.1 

1997-11 

61.8 

trimestrales para Rampart 
Industries 

1996-1 

35.6 

III 

75.9 


II 

42.8 

IV 

74.1 


III 

50.3 

1998-1 

88.7 


IV 

49.2 

II 

79.1 


1997-1 

62.0 

III 

92.5 


El proposito del analisis de las series de tiempo es predecir o proyectar los valores futuros de la variable a 
partir de observaciones anteriores. Un metodo directo es el metodo intuitivo de proyeccion, el cual presume que 
el mejor predictor del valor de la variable en el siguiente perfodo es su valor en el perfodo corriente. En su forma 
mas simple puede expresarse como: 


Modelo de proyeccion 

intuitivo ^+1 = Y t [13.1] 


en donde Y t + } es el estimado del valor de la serie de tiempo en el siguiente periodo t + 1 , y Y es el valor real en el 
perfodo corriente t. Este metodo se utiliza con frecuencia con los datos que presentan una caminata aleatoria. Los 
movimientos de caminata aleatoria no presentan tendencia ascendente o descendente y cambian de direction 
subitamente. Tales movimientos son analogos a un paseo noctumo a ningun sitio en especial. Cuando llega a una 
intersection, decide aleatoriamente, quiza lanzando una moneda, que camino tomar. Tal aleatoriedad no puede 
predecirse, y lo mejor que se puede hacer es utilizar la observation mas reciente como prediction para el siguiente 
valor. Este metodo de pronostico es mas exitoso para los datos que se recogen para intervalos cortos de tiempo, 
tales como los diarios o los semanales. 

Sin embargo, la mayorfa de las series de tiempo son mas complejas. Todas las series de tiempo contienen por 
lo menos uno de los siguientes cuatro componentes: 1) tendencia secular; 2) variacion estacional; 3) variacion 
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ciclica; o 4) variation irregular, o aleatoria. En esta section se analizaran cada uno de estos componentes de las 
series de tiempo. 


A. Tendencia secular 

La tendencia secular, o simplemente la tendencia, es la conducta a largo plazo de la variable durante un perfodo 
de longitud prolong ada. Refleja la direction general de la serie de tiempo como ascendente o descendente. 
Algunos ejemplos incluyen el creciente numero de autos vendidos en Estados Unidos, el incremento en el 
volumen de las transactions de credito durante los ultimos anos, y el movimiento descendente en el numero de 
personas que viven en areas rurales en las ultimas dos decadas. 


Tendencia secular El movimiento continuo en una variable durante un periodo de 
tiempo extendido. 


La figura 13.1 muestra la tendencia en la production de Rampart Industries para la ultima decada. Aunque los 
datos muestran una variacion considerable por encima y por debajo de la recta de tendencia, dibujada con la mitad 
de los datos, la tendencia secular es, sin equivocarse, ascendente. 


Figura 13.1 

La recta de tendencia 
para Rampart B 

Industries (reporte : i 

anual) J 


B. El componente estacional 

Gran parte de la actividad comercial se ve influenciada por las cambiantes estaciones del ano. Por ejemplo, las 
ventas de ciertos bienes estacionarios como las motonieves Honda, vestidos de bano Jantzen, y taijetas de amor 
y amistad de Hallmark, probablemente presentarfan un componente altamente estacional. Las fluctuaciones 
estacionales son patrones que tienden a ocurrir de nuevo, regularmente, durante el periodo. Aunque se piensa 
con frecuencia que las variaciones estacionales ocurren regularmente cada ano, como las ventas anuales de 
jamones de navidad, el periodo en cuestion puede ser mucho mas corto. El flujo diario de clientes a la barra de 
comidas cada medio dia es un ejemplo. Si la variacion estacional no ocurre anualmente, los datos anuales no 
capturaran o reflejaran tales cambios. Los datos deben recolectarse trimestral, mensual o incluso semanalmente. 



Ano 


Variaciones estacionales Movimientos en las series de tiempo que ocurren de nuevo 
cada ano por la misma epoca. 
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La figura 13.2 muestra que cada ano la tasa de desempleo tiende a subir en el mes de mayo, cuando los 
estudiantes de bachillerato ingresan al mercado laboral del verano, y luego baja en noviembre cuando las tiendas 
minoristas contratan ayuda temporal para atender la epoca de navidad. Vale la pena destacar que no existe 
ninguna tendencia evidente en la tasa de desempleo. 


Figura 13.2 

Variaciones estacionales 
en el desempleo 



C. Variaciones ci'dicas 

Muchas variables presentan una tendencia a la variation por encima y por debajo de la tendencia a largo plazo, 
durante un periodo prolongado de tiempo. Tales fluctuaciones se denominan variaciones ciclicas o ciclos 
comerciales. Abarcan periodos mucho mas prolongados que las variaciones estacionales, y con frecuencia 
incluyen tres o mas anos de duration. 


Variaciones ciclicas Son variaciones como de onda en el nivel general de la actividad 
comercial durante un periodo relativamente prolongado. 


Un ciclo contiene cuatro fases: 1) Alza o expansion, durante la cual el nivel de actividad comercial se acelera, 
el desempleo es bajo y la production es rapida; 2) el pico, en el cual la tasa de actividad economica tiene “el punto 
mas alto”; 3) el descenso, o contraction, cuando el desempleo sube y la actividad se merma; y 4) la depresion, 
cuando la actividad esta en su punto minimo. Un ciclo va desde una fase hasta la siguiente, y tal como se ilustra 
en la figura 13.3, vaiia por encima y por debajo de la tendencia a largo plazo, de manera ondular. 


Figura 13.3 

Variaciones ciclicas 
de las importaciones 
de autos 



Anos 
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D. Variaciones irregulares 

Las series de tiempo tambien contienen variaciones irregulares o aleatorias, producidas por sucesos inusuales, 
que producen movimientos sin un patron discernible. Tales movimientos son, como las huellas y los copos de 
nieve, unions y probablemente no ocurriran de nuevo de la misma manera. Pueden ser producidos por eventos 
tales como guerras, inundaciones, terremotos, elecciones polfticas, o embargos del petroleo. 


13.3 Modelos de series de tiempo 

Un modelo de series de tiempo puede expresarse como alguna combination de estos cuatro componentes. El 
modelo es simplemente una expresion matemdtica de la relation entre los cuatro componentes. Comunmente dos 
tipos de modelos se relacionan con las series de tiempo: 1) el modelo aditivo y 2) el modelo multiplicative. El 
modelo aditivo se expresa como: 

Y, = T, + S, + C, + I, 

en donde Y t es el valor de la serie de tiempo para el perfodo t, y la tendencia son los valores al lado derecho, la 
variacion estacional, la variacion cfclica, y la variacion aleatoria o irregular, respectivamente, para el mismo periodo. 
En el modelo aditivo, todos los valores estin expresados en unidades originales, y S, C, e / son desviaciones 
alrededor de T. Si se desarrollara un modelo de series de tiempo para las ventas en dolares de una tienda minorista 
local, se puede encontrar que T = US$500, S = US$ 100, C = -US$25, e /= -US$10. Las ventas serian 

Y = US$500 + US$100-US$25-US$10 
= US$565 

Vale la pena destacar que el valor positivo para S indica que las influences estacionales existentes han tenido un 
impacto positivo en las ventas. El valor cfclico negativo sugiere que el ciclo comercial esta actualmente 
descendiendo. Aparentemente, sucedio algun evento aleatorio que tuvo un impacto negativo en las ventas. 

El modelo aditivo sufre del supuesto, algo irreal, de que los componentes son independientes uno del otro. 
Esto rara vez es el caso en la vida real. En la mayorfa de los casos, los movimientos de un componente tendran un 
impacto en los otros componentes, por tanto, se niega el supuesto de independencia. O quizas de manera mas 
comun, con frecuencia se encuentran que ciertas fuerzas que trabajan en la economfa, simultaneamente afectan 
dos o mas componentes. De nuevo, el supuesto de independencia no se cumple. 

Como resultado, el modelo multiplicativo es el que se prefiere con frecuencia; supone que los componentes 
interactuan entre si y no se mueven indenendientemente. El modelo multiplicativo se expresa como: 

Y, = T,X S,X C, X /, 

En el modelo multiplicativo, solo T se expresa en las unidades originales, y S, C, e / se expresan en terminos de 
porcentajes. Por ejemplo, los valores para las deudas morosas en un banco comercial pueden registrarse como T 
— US$10,000,000, S= 1.7, C = 0.91 e/ = 0.87. Las deudas morosas podrian entonces calcularse como: 

Y= (10)(1.7)(0.91)(0.87)=US $13.46 millones 

Debido a que las fluctuaciones ocurren dentro de perfodos de menos de un ano, podrian no estar reflejados en 
los datos anuales. Una serie de tiempo para datos anuales se expresaria como 

Y, = r, X C, X 1 , 

13.4 Tecnicas de suavizamiento 

El comportamiento general de una variable, con frecuencia puede analizarse mejor observando su tendencia a 
largo plazo. Sin embargo, si la serie de tiempo contiene demasiadas variaciones o cambios estacionales a corto 
plazo, la tendencia puede ser algo confusa y dificil de observar. Es posible eliminar muchos de estos factores que 
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se pueden confundir promediando los datos de varios periodos. Esto se logra utilizando ciertas tecnicas de 
suavizamiento o suavizacion que eliminan las fluctuaciones aleatorias de la serie, proporcionando por tanto un 
panorama menos distorsionado de la conducta real de la serie. Se analizaran dos metodos comunes de suavizamiento 
de los datos de series de tiempo: promedio movil y suavizamiento exponencial. 


A. Promedios moviles 

Un promedio movil (PM) tendra el efecto de “suavizamiento” de los datos, produciendo un movimiento con 
menos picos y valles. Se calcula promediando los valores en la serie de tiempo sobre un numero fijo de perfodos. 
El mismo numero de perfodos se mantiene para cada promedio, eliminando la observation mas antigua y recogiendo 
la mas reciente. Se supone que los precios de cierre para una action en la Bolsa de Valores de Nueva York, para el 
perfodo de lunes a miercoles, fueron de US$20, US$22, y US$18, respectivamente. Se calcula un promedio movil de 
tres perfodos (dia) asi: 

(20 + 22 + 18)/3 = 20 

Este valor de 20 sirve entonces como proyeccion o estimado de lo que puede ser el precio de cierre en cualquier 
momento futuro. Si el cierre del jueves es de 19, el siguiente promedio movil se calcula quitando el valor del lunes 
de 20 y utilizando el precio de cierre del jueves que es 19. Asi, la proyeccion es: 

(22 + 18 +19)/3 = 19.67 

El estimado que ha sido calculado de esta manera, se observa como el promedio a largo plazo de la serie. Se 
toma como el pronostico para el precio de cierre en cualquier dia futuro. 


Promedio movil (PM) Una serie de promedios aritmeticos sobre un numero dado de 
periodos; es la estimation del promedio de la variable a largo plazo. 


En la tabla 13.2 se presentan las ventas para Arthur Momitor’s Snowmobiles, Inc., durante los ultimos 12 
meses. Se calculan tanto un PM de tres meses, como uno de cinco meses. Se obtiene la primera entrada en el PM 
de tres meses promediando las ventas de motonieves en enero, febrero y marzo. El valor resultante de (52 + 81 + 
47) / 3 = 60 se centra en el perfodo medio de febrero. Se determina la siguiente entrada promediando febrero, marzo 
y abril, y centrando el valor de 64.33 en el medio de estos tres periodos, que es marzo. El resto de entradas se 
determinan de manera similar. 


Tabla 13.2 

Mes 

Ventas (US$100) 

PM de tres meses PM de cinco meses 

Ventas de motonieves 

Enero 

52 


para Arthur Momitor 

Febrero 

81 

60.00 


Marzo 

47 

64.33 59.00 


Abril 

65 

54.00 

63.20 

Mayo 

50 

62.67 

56.00 

Junio 

73 

56.00 

58.60 

Julio 

45 

59.33 

55.60 

Agosto 

60 

51.67 

61.40 

Septiembre 

50 

63.00 

55.80 

Octubre 

79 

58.00 

59.20 

Noviembre 

45 

62.00 


Diciembre 

62 




La primera entrada de cinco meses en el PM utiliza valores para los meses de enero a mayo. El promedio de (52 
+ 51 + 47 + 65 + 50) /5 = 59 se centra en la mitad de tales cinco periodos en marzo. 
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Los promedios moviles tienen el efecto de suavizamiento en las variaciones grandes de los datos. Este efecto 
de suavizamiento ocurre porque observaciones inusualmente pequenas se promedian con otros valores, y por 
tanto su impacto se mitiga. Entre mas grande sea el numero de periodos en un promedio movil, mas pronunciado 
sera el efecto de suavizamiento. Vale la pena notar que el rango de valores en un PM de tres meses, es menor que 
en los datos originales y mayor que en el rango hallado en el PM de cinco meses. La figura 13.4 ilustra esta 
tendencia del efecto de suavizamiento a incrementar con el numero de periodos en el promedio movil. 


Figura 13.4 

Comparacion de los 
promedios moviles 



Cuando un numero impar de periodos se utiliza en el promedio movil, los resultados pueden centrarse 
automaticamente en el periodo de la mitad. Cuando Arthur Momitor calculo su promedio movil de tres meses para 
las motonieves, el primer valor podria centrarse de inmediato en el periodo de la mitad, es decir, febrero. 

Sin embargo, si existe un numero par de periodos en el promedio, debe hacerse un ajuste ya que no existe una 
observation en la mitad en la cual se centre automaticamente el valor. Se consideran los datos de ventas 
trimestralmente para Sun Shine Greetings Cards (Tarjetas de saludos de Sun Shine) en la tabla 13.3. Los datos van 
desde el primer trimestre de 1996, hasta el ultimo trimestre de 1998. Si se va a calcular un PM de cuatro periodos 
(trimestres), la primera entrada de 42.50 se obtiene promediando los datos para los cuatro trimestres de 1996. Sin 
embargo este valor no corresponde a ningun periodo especifico en la serie original de datos, pero se fija entre el 
segundo y el tercer trimestre de 1996. Las entradas restantes estan a la misma distancia del centro. 


Tabla 13.3 


Ventas para Sun 
Shine Cards 


(US$1,000) 


Periodo 

Ventas 

PM de cuatro trimestres 

PM de cuatro trimestres 




centra do 

1996-1 

40 



II 

45 

42.50 


III 

38 

45.75 

44.13 

IV 

47 


45.00 

44.25 


1997-1 

53 

46.50 

45.38 

II 

39 

42.75 

44.63 

III 

47 

42.25 

42.50 

IV 

32 


43.00 

43.75 


1998-1 

51 

41.25 

42.50 

II 

45 

46.75 

44.00 

III 

37 



IV 

54 




Es necesario centrar el promedio movil tomando la media de cada par sucesivo de promedios moviles. Asi, el 
promedio del primer y del segundo valor resulta: 

(42.50 + 45.75) /2 = 44. 13 
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el cual se centra en el tercer trimestre. La siguiente entrada de 45.00 se obtiene promediando el segundo y el tercer 
valor: 

(45.75 + 44.25)/2 = 45.00 

el cual esta centrado en el cuarto trimestre de 1996. De igual forma, los valores restantes estan centrados en sus 
respectivos perfodos. 

Los promedios moviles pueden utilizarse para eliminar variaciones irregulares y estacionales. Cada entrada en 
el PM se deriva de cuatro trimestres, es decir, el valor de todo un ano. Por tanto, el promedio m6vil “promedia” 
toda variacion estacional que pueda ocurrir dentro del ano, eliminandolas de manera efectiva y dejando solo la 
tendencia y las variaciones ciclicas. 

En general, si el numero de periodos en un promedio movil es suficiente como para abarcar todo un ano (si se 
utilizan datos de 12 meses; 52 si se utilizan datos semanales), las variaciones estacionales se promedian y se 
eliminan de la serie. Entonces se afirma que los datos estan desestacionalizados. 

Como se expreso anteriormente, el uso de un numero mayor de periodos termina en una serie promediada mas 
suave. Asi pues, si los datos son muy volatiles, serfa conveniente utilizar en el pronostico un numero de periodos 
mas pequeno, para asi evitar colocar la proyeccion muy cerca al promedio a largo plazo. Si los datos no varian 
mucho de la media a largo plazo, serfa necesario utilizar un numero mayor de periodos en la creacion del promedio 
movil. 


La pantalla de Minitab 13.1 muestra una impresion en Minitab para el ejemplo de las taijetas Sun Shine. El 
ejemplo 13.1 muestra el metodo del promedio movil. 


Pantalla 

en Minitab 13.1 





Four-period moving 
de las tar j etas de 

average for Sun 
Sun Shine) 

Shine cards 

(Promedio movil para cuatro periodos 

Row Period 

Cl 

.MA 

Predict 

Error 

Row = Fila 

1 

1 

40 

* 

* 

* 

Period = Periodo 

2 

2 

45 

* 

* 

* 

Cl = Tarjeta 1 

3 

3 

38 

44.125 

* 

* 

.MA = Promedio movil 

4 

4 

47 

45.000 

* 

★ 

Predict- Pronostico 

5 

5 

53 

45.375 

* 

* 

6 

6 

39 

44.625 

44.125 

-5.125 


7 

7 

47 

42.500 

45.000 

2.000 


8 

8 

32 

43.000 

45.375 

-13.375 


9 

9 

51 

42.500 

44.625 

6.375 


10 

10 

45 

44.000 

42.500 

2.500 


11 

11 

37 

* 

43.000 

-6.000 


2 

12 

54 

* 

42.500 

11.500 



Vi 

a 




• Real 

^ Proyectado 

♦ Pronostico 
Real 

Proyectado 

Pronostico 

Moving average = Promedio movil 
Length : 4 = Duration : 4 

MAPE: 16.3945 

MAD: 6.6964 

MSD: 60.6138 


Tiempo 
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Ejemplo 13.1 

TransAmerica Trucking ha recolectado datos para los ultimos 10 meses sobre las toneladas de 
envios. Ayude al departamento de investigation calculando el promedio movil de tres periodos. 
^Cual es su pronostico para los envios en el futuro? 


Solution 


Mes 

Envios 

PM de tres periodos 

Mes 

Envios 

PM de tres periodos 

1 

70 


6 

81 

76.67 

2 

68 

71.00 

7 

82 

77.33 

3 

75 

74.00 

8 

69 

74.33 

4 

79 

73.67 

9 

72 

69.67 

5 

67 

75.67 

10 

68 



Los tres primeros valores de 70, 68, y 75 promedian 71. Los valores para los periodos dos al cuatro 
de 68, 75 y 79, promedian 74. El proceso continua hasta que se encuentre la ultima observation. La 
proyeccion para todo mes futuro es de 69.67 toneladas. 

Interpretation 

Debido a que los datos no presentan ninguna tendencia ascendente o descendente, la tecnica de 
promedio movil se ajusta para proyectar envios futuros. El pronostico de 69.67 claro que cambiara, 
cuando se reporte el envio del mes 11 y se calcule el promedio movil para el mes 10. 


B. Suavizamiento exponencial 

Como su nombre lo indica, el suavizamiento exponencial tiene el efecto de suavizar una serie. Tambien proporciona 
un medio efectivo de prediction. Suavizamiento exponencial de primer orden se utiliza cuando los datos no 
presentan ningun patron de tendencia. El modelo contiene un mecanismo de autocorreccion que ajusta los 
pronosticos en direction opuesta a los errores pasados. La ecuacion es: 


Suavizamiento exponencial F ,+\ - + 0 ~~ °) F , [13.2] 


en donde F l+1 es el pronostico para el siguiente periodo 

A' es el valor real observado para el periodo corriente 

F ( es la proyeccion hecha previamente para el periodo corriente 

a es una “constante de suavizamiento” a la cual se le da un valor entre 0 y 1. Teniendo en cuenta que los datos no 
tienen tendencia ascendente o descendente, pero varian alrededor de algun promedio a largo plazo, se toma el 
valor F como prondstico para cualquier periodo futuro. 


Suavizamiento exponencial Herramienta de proyeccion en la cual el pronostico se 
basa en un promedio ponderado de los valores actuales y anteriores. 


Como ejemplo, se supone que es el ultimo dia habil del mes de febrero. Las ventas totales del mes para Uncle 
Vito’s Cars fueron de US$110,000. Uncle Vito ha decidido pronosticar las ventas para el mes de marzo. De acuerdo 
con la formula [13.2], la proyeccion de marzo, F t+i requiere: 
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1. Ventas reales de febrero, 

2. Pronostico para febrero, F. 

Sin embargo, debido a que marzo es el primer mes en el cual Uncle Vito esta haciendo su prediction, no se hizo 
pronostico para el mes de febrero y F es desconocido. La practica general es utilizar simplemente el valor real del 
periodo anterior, enero en este caso, para la primera proyeccion. Los registros de Uncle Vito demuestran que las 
ventas de enero fueron de US$105,000. Se asume un valor de 0.3 para a, entonces el pronostico para marzo es: 

F l+i = aA, + (1 - a)F, 

— ocA Feb + (1 — a)F Feh 
= (0.3)(110) + (0.7)(105) 

= US$106,500 como la proyeccion de las ventas en marzo. 

Como lo revela la tabla 13.4, Uncle Vito puede planear ventas de US$106,500. Si las ventas reales de marzo son 
de US$107,000, el error se calcula (en miles) como F t -A t = 106.5 - 107 = -0.5. Tambien F = (0.3)(107) + 
(0.7X106.5) =106.65. 


Tabla 13.4 

Mes 

Proyeccion 

Real 

Error (F t - A t ) 

Venta de autos 

Enero 

- 

105 


de Uncle Vito 

Febrero 

105 

110 

-5.0 


Marzo 

106.5 

107 

-0.5 

Abril 

106.65 

112 

-5.3! 


Se asume que las ventas en abril fueron de US$112,000. Entonces el error es -US$5,350. Uncle Vito puede 
predecir tambien las ventas de mayo asi: 

F l+i =aA, + (1 -a)F, 

F\layo (l ®-)^Abril 

= (0.3X112) + (0.7X106.65) 

= $108,260 

Claro, que el valor seleccionado para a es crucial. Debido a que se desea producir un pronostico con el error 
mas pequeno posible, el valor a que minimiza el cuadrado medio del error (CME) debe ser optimo. El ensayo y error 
sirve con frecuencia como el mejor metodo para determinar el valor a apropiado. La tabla 13.5 contiene los datos 
de las ventas reales de Uncle Vito para los primeros siete meses. Los errores se basan en las proyecciones que se 
calcularon utilizando los valores a de 0.3 y 0.8. El CME es 


Cuadrado medio del 

error 


CME = ^ F ' 
n — 

A) 2 

1 


[13.3] 

Tabla 13.5 

Mes 

Real 

Proyeccion (a = 0.3) 

Error 

Proyeccion (a = 0.8) 

Error 

Datos de las ventas 

Enero 

105 





de Uncle Vito 

Febrero 

110 

105.00 

-5.00 

105.00 

-5.00 


Marzo 

107 

106.50 

-0.50 

109.00 

2.00 


Abril 

112 

106.65 

-5.35 

107.40 

-4.60 


Mayo 

117 

108.26 

-8.74 

111.08 

-5.92 


Junio 

109 

110.88 

1.88 

115.82 

6.82 


Julio 

108 

110.32 

2.32 

110.36 

2.36 


Agosto 


109.62 


108.47 
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Para a = 0.3, CME es: 

CME 


(~5) 2 + (— 0.5) 2 + (— 5.35) 2 + (— 8.74) 2 + (1.88) 2 + (2.32) 2 


Un a de 0.8 

_ (-5) 2 + (2) 2 + (-4.6) 2 + (— 5.92) 2 + (6.82) 2 + (2.36) 2 

CME = 

= 22.88 

Un a de 0.8 produce mejores resultados de pronostico debido a que genera un factor de error mas pequeno. 
Otros valores de a pueden probarse para determinar su impacto en CME y en la exactitud de las proyecciones 
resultantes. Generalmente hablando, si los datos son volatiles se precisa un menor valor a. Esto se debe a que los 
valores mas pequenos para a asignan menos peso a las observaciones mas recientes. Si los datos presentan un 
movimiento considerable, la ultima observation puede no ser representativa del promedio a largo plazo. 

Vale la pena recordar, que el suavizamiento exponencial de primer orden, en la forma aqui descrita, es apropiado 
si los datos no presentan tendencia pero se mueven alrededor de algun valor promedio a largo plazo. Si una 
tendencia descendente o una ascendente puede detectarse representando los datos, deberia utilizarse el 
suavizamiento exponencial de segundo orden, cuya mecanica no se analizara aqui. 


Ejemplo 13.2 Prediction de las tasas de desempleo 

Los indices mensuales de desempleo para 1997 se presentan a continuation. Como analista del 
Ministerio de Trabajo de los Estados Unidos, usted debe: 1) suavizar las fluctuations utilizando 
un promedio movil con cuatro periodos, y 2) utilizar un modelo de suavizamiento exponencial 
fijando a en 0.4 para proyectar el desempleo para algun mes futuro. Los datos no demuestran 
ninguna tendencia pronunciada ascendente o descendente. 


Enero 

5.4 

Julio 

5.4 

Febrero 

5.1 

Agosto 

5.5 

Marzo 

5.0 

Septiembre 

5.2 

Abril 

5.2 

Octubre 

5.5 

Mayo 

5.3 

Noviembre 

5.1 

Junio 

5.3 

Diciembre 

5.4 


Solution: 


Mes 

Tasa 

PM 

PM centrado 

F t 

Enero de 1997 

5.4 




Febrero 

5.1 

5.175 


5.4 

Marzo 

5.0 

5.150 

5.163 

5.28 

Abril 

5.2 

5.200 

5.175 

5.17 

Mayo 

5.3 

5.300 

5.250 

5.18 

Junio 

5.3 

5.375 

5.338 

5.23 

Julio 

5.4 

5.350 

5.363 

5.26 

Agosto 

5.5 

5.400 

5.375 

5.31 

Septiembre 

5.2 

5.325 

5.363 

5.39 

Octubre 

5.5 

5.300 

5.313 

5.31 

Noviembre 

5.1 



5.39 

Diciembre 

5.4 



5.27 

Enero de 1998 




5.32 
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La tabla muestra el primer promedio movii de 5.175, calculado al promediar los indices de enero a 
abril. Se situa en medio de los cuatro meses entre febrero y marzo. La segunda entrada de 5.150 es 
el promedio de los meses de febrero a mayo y se coloca entre marzo y abril. Los valores restantes 
para PM se calculan de forma similar. Estos valores se centran luego promediando pares sucesivos 
de promedios moviles. 

Para proyectar haciendo uso del suavizamiento exponential, se deben calcular las cifras 
pronosticadas para febrero a diciembre, para poder obtener F Dic = 5.27, el cual se utiliza luego en la 
proyeccion de enero de 1998: 

F E „ e = a(A Dic ) + (1 - a)(F Dic ) 

= (0.4)(5.4) 4- (0.6)(5.27) 

= 5.32% 

Interpretation 

El metodo de promedio movii pronostica una tasa de 5.313%. El suavizamiento exponencial 
proporciona un pronostico de 5.32%. Este valor (de 5.313% o 5.32%) es el pronostico para enero, o 
para cualquier periodo futuro, ya que los datos no presentan una tendencia sino que supone que 
varian o fluctuan a largo plazo alrededor de este promedio. 


A diferencia de los promedios moviles, los cuales utilizan solo un numero fijo de periodos, el suavizamiento 
exponencial utiliza todos los valores anteriores de la serie de tiempo. Esto se debe a que F depende de y F. 
Sin embargo, F utilizo A t] y F tl en su calculo, y F t} utilizo A t2 y F t2 . Por tanto, cada pronostico depende de los 
valores reales anteriores de A ( n hasta llegar a donde comenzaron los pronosticos por primera vez. Entre mas se 
vaya hacia atras en el tiempo, menos impacto tiene un valor de A en la proyeccion corriente. 


Ejercicios de la seccion 


1. Si los datos en una serie temporal tienen una varianza grande, ^podria utilizarse un promedio movii con un 
numero mayor de periodos, o uno con un numero menor de periodos? ^Por que? 

2. ^Por que se debe utilizar un promedio movii solo cuando los datos no presentan tendencia ni ascendente ni 
descendente? 

3. A continuation se presenta el numero de llamadas telefonicas diarias que ingresan a un conmutador de una 
oficina muy ocupada. Calcule el promedio movii para tres periodos. 

Dia 1 23456789 10 11 

Llamadas 40 37 45 32 42 47 39 47 41 36 38 

4. A continuation se presenta el numero de empleados que se ausentan diariamente de sus trabajos en una 
fabrica grande. Calcule el promedio movii de cuatro periodos relacionado con estos datos. Centre los 
promedios. 

Dia 1 2 3 4 5 6 7 8 9 10 11 12 

Empleados 45 54 63 39 42 31 48 54 64 36 41 52 

5. Las existencias excedentes para Mom’s Apple Pies, Inc., durante las ultimas 10 semanas han sido 101, 122, 
109, 111, 120, 117, 115, 118, 112 y 117. Utilice el suavizamiento exponencial con a 0.20 y proyecte las existencias 
para la semana numero once. 
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6. Los creditos mensuales en miles de dolares en el banco local son 211, 234, 209, 217, 215, 232, 221, 211 y 203. 
Utilice el suavizamiento exponencial para proyectar los creditos al siguiente periodo utilizando un valor a de 
0.10. Calcule el cuadrado medio del error y comparelo con el cuadrado medio del error si a es 0.80. ^Cual valor 
a proporciona el mejor pronostico? 


13.5 Analisis de tendencia 

Si una serie de tiempo tiene una tendencia ascendente o descendente a largo plazo (como por ejemplo en la figura 
13.1), el analisis de tendencia puede ser util para desarrollar pronosticos. Es decir, si una tendencia esta presente 
debido a que los datos no varian alrededor de algun promedio a largo plazo como los de las tarjetas Sun Shine 
discutidos anteriormente, los metodos de suavizamiento como el promedio movil y el suavizamiento exponencial 
no son apropiados. En su lugar, se puede estimar una recta de tendencia, utilizando las tecnicas para la regresion 
simple discutida en el capitulo 11. La variable dependiente es la serie de tiempo que se desea pronosticar y el 
tiempo se utiliza como variable independiente. El modelo a estimar es simplemente: 


Recta de tendencia utilizando 
regresion simple 


t = h o + V 


[ 13 . 4 ] 


Considerando los datos para el numero de casas iniciadas (en cientos) en Happy Valley, California, que se 
observan en la tabla 13.6, Mayfield Construction desea ajustar su serie de tiempo utilizando MCO en el desarrollo 


de un modelo para predecir futuros comienzos de construccion de vivienda. 

Tabla 13.6 

Ano 

too 

Comienzos de casas (YJ 

XY 

X 2 

Comienzo 

1983 

1 

7.0 

7.0 

1 

de construccion de casas 

1984 

2 

7.1 

14.2 

4 

en Happy Valley 

1985 

3 

7.9 

23.7 

9 

(en 1000's) 

1986 

4 

7.3 

29.2 

16 


1987 

5 

8.2 

41.0 

25 


1988 

6 

8.3 

49.8 

36 


1989 

7 

8.1 

56.7 

49 


1990 

8 

8.6 

68.8 

64 


1991 

9 

8.8 

79.2 

81 


1992 

10 

8.9 

89.0 

100 


1993 

11 

8.7 

95.7 

121 


1994 

12 

9.1 

109.2 

144 


1995 

13 

9.4 

122.2 

169 


1996 

14 

9.1 

127.4 

196 


1997 

15 

9.5 

142.5 

225 


1998 

16 

9.9 

158.4 

256 



136 

135.9 

1,214.0 

1,496.0 


Los valores para t se obtienen codificando el periodo, iniciando con 1 para el primer periodo, 2 para el 
segundo, y asi sucesivamente. Como se aprendio en el capitulo 11, las sumas de cuadrados y productos cruzados 
utilizados para calcular la recta de regresion son: 
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= 58.85 


Las formulas para b } y b Q son: 


Pendiente de la recta de tendencia 

_ SCxy 

1 SCx 

[13.7] 


_ 58.85 

340 

= 0.173 


Intercepto de la recta de tendencia 

b 0 = Y — biX 

[13.8] 


= 7.02 



La ecuacion para la recta de tendencia es: 
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Dada esta ecuacion, es posible predecir periodos futuros, el numero de viviendas iniciadas simplemente 
substituyendo el valor apropiado por t Se supone que Mayfield Construction desea pronosticar para 1999 las 
viviendas iniciadas. Debido a que el valor t seria 17 en 1999, la proyeccion seria: 

7.02 + 0.173(17) 

= 9.96 

o 9,960 viviendas iniciadas, debido a que los datos se expresaron en unidades de 1,000. 

De igual manera, debido a que 2001 tendria un valor t de 19, el pronostico para 2001 seria 

Y = 7.02 + 0.173(19) 

= 10.31 

Se estima que en el 2001 habra 1,031 viviendas en construction. 

Claro que entre mas lejana en el futuro se haga una proyeccion, menos confiable es su resultado. 
Adicionalmente, su precision se basa en la condition de que el pasado proporcione un panorama representative 
de las tendencias futuras. 


Ejemplo 13.3 

Larry’s Lawn Service hace publicidad de un nuevo quimico para erradicar las malezas. Para determinar 
la tendencia en el numero de clientes, Larry consulta los registros de la Compama y encuentra los 
datos que aparecen a continuation. El desea pronosticar el numero de clientes para los periodos 
futuros. 


Periodo 

t(X) 

Clientes (Y) 

XY 

X 2 

Enero de 1997 

1 

41 

41 

1 

Febrero 

2 

43 

86 

4 

Marzo 

3 

39 

117 

9 

Abril 

4 

37 

148 

16 

Mayo 

5 

42 

210 

25 

Junio 

6 

35 

210 

36 

Julio 

7 

30 

210 

49 

Agosto 

8 

31 

248 

64 

Septiembre 

9 

32 

288 

81 

Octubre 

10 

30 

300 

100 

Noviembre 

11 

28 

308 

121 

Diciembre 

12 

28 

336 

144 

Enero de 1998 

13 

29 

377 

169 

Febrero 

14 

26 

364 

196 


105 

471 

3,243 

1,015 


Solution 


SCx 


1,015 - 
227.5 


(105) 2 

14 


SCxy = 3,243 


(105X471) 

14 


- 289.5 
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b x = - 1.27 
b 0 = Y - b t X 

= 33.64 - ( - 1.27)(7.5) 

= 43.2 

La ecuacion para la recta de tendencia es: 

Y, = 43.2 - 1.27? 

Si Larry desea pronosticar el numero de clientes que puede conseguir su empresa en marzo de 1998, 
el cual seria el periodo 15, tendria: 

F Mar = 43.2 - 1.27(15) 

= 24.15,o 24 clientes 

La proyeccion para agosto es: 

Y Aga = 43.2 - 1.27(21) 

= 16.53 clientes 


Interpretation 

El coeficiente negativo para t de — 1.27 indica a Larry que el negocio esta descendiendo a una tasa 
de 1.27 clientes por cada periodo (mes). 


Ejercicios de la seccion 


7. A continuation aparecen los puntajes de las pruebas nacionales anuales, de los estudiantes de ultimo ano de 
bachillerato que estan solicitando ingreso a las universidades. Desarrolle una recta de tendencia y proyecte 
el puntaje del examen para 1998. 

1989 1990 1991 1992 1993 1994 1995 1996 1997 

Puntaje 412 423 453 432 541 539 587 591 602 


8. El departamento de investigation de National Industries ha registrado el nivel de production en miles de 
unidades, producidas durante los ultimos meses. Utilizando los datos que aqui se muestran, desarrolle una 
recta de tendencia y una proyeccion para la production de noviembre y diciembre. 


Enero Febrero Marzo Abril Mayo Junio Julio Agosto 

Produccion 89 78 71 75 68 61 65 54 


9. City Utilities ha experimentado una rapida expansion durante los ultimos anos. Este crecimiento ha requerido 
cada ano adiciones a la fuerza laboral. Utilice el analisis de tendencia para predecir el tamano de la fuerza 
laboral (en cientos) para el ano 2001. 


1990 

1991 

1992 

1993 

1994 

1995 

1996 

1997 

1998 

Empleados 3.5 

4.8 

5.2 

4.9 

5.6 

5.2 

6.5 

7.8 

8.5 
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13.6 Descomposicion de las series de tiempo 

Con frecuencia es util descomponer una serie de tiempo o una serie temporal “desglosando” cada uno de sus 
cuatro componentes. Asi, cada componente se puede examinar individualmente. La tendencia historica puede 
reflejar patrones anteriores de comportamiento, permitiendo ganar discemimiento en cuanto a los movimientos a 
largo plazo de las variables que se desea examinar. Esto permite el desarrollo de modelos de tendencia, utiles en la 
proyeccion y pronostico, tal como se estudio en la section anterior que se referia al analisis de tendencia. A1 
analizar el factor estacional se puede determinar si la actividad comercial presenta alguna variation estacional, 
que pueda considerarse para formular planes futuros. Por ejemplo, si se comercializan trajes de bano o algun otro 
producto estacional, se puede encontrar que las ventas son mucho mas altas en primavera que en otorio o en 
invierno. Ademas, el desempeno ciclico del negocio puede tambien influir en la direction de la planeacion del 
negocio. 


A. Aislamiento de la componente estacional 

El primer paso en el desglosamiento es obtener un rndice estacional. Se consideran los datos de la tabla 13.7 para 
Vinnie’s Video Village. Una evaluation superficial revela que las utilidades parecen ser mas altas durante los 
meses de verano, cuando las escuelas estan de vacaciones, y mas bajas en otras epocas del ano. Esto sugiere la 
presencia de factores estacionales. 


Tabla 13.7 

Variaciones 
estacionales en las 
utilidades de Vinnie 


Perfodo Utilidades PM de 12 

(cientos de dolares) meses (T-C) 

PM centrado 

Razon con PM 
Y/CMA = S - / 

1996 





Enero 

10 




Febrero 

9 




Marzo 

11 




Abril 

12 




Mayo 

18 




Junio 

23 






15.5833 



Julio 

27 


15.5417 

1.7373 



1 5.5000 



Agosto 

26 

15.6667 

15.5833 

1.6685 

Septiembre 

18 

15.5833 

15.6250 

1.1520 

Octubre 

13 


15.5833 

0.8342 



15.5833 



Noviembre 

10 


15.6250 

0.6400 



15.6667 



Diciembre 

10 


15.7500 

0.6349 



15.8333 



1997 





Enero 

9 

15.9167 

15.8750 

0.5669 

Febrero 

11 

16.3333 

16.1250 

0.6822 

Marzo 

10 

16.6667 

16.5000 

0.6061 

Abril 

12 

16.8333 

16.7500 

0.7164 

Mayo 

19 

16.9167 

16.8750 

1.1259 

Junio 

25 

17.0833 

1 7.0000 

1.4706 

Julio 

28 

17.1667 

17.1250 

1.6350 

Agosto 

31 

16.9167 

17.0417 

1.8191 


(Continua) 
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Perfodo (Y) Utilidades PM de 12 

(cientos de dolares) meses (T-C) 

PM centrado 

Razon con PM 
Y/CMA = S-/ 

Septiembre 

22 

16.9167 

16.9167 

1.3005 

Octubre 

15 

16.9167 

16.9167 

0.8867 

Noviembre 

11 

16.9167 

16.9167 

0.6502 

Diciembre 

12 

16.9167 

16.9167 

0.7094 

1998 





Enero 

10 

17.0000 

16.9583 

0.5897 

Febrero 

8 

17.0000 

17.0000 

0.4706 

Marzo 

10 

16.9167 

16.9583 

0.5897 

Abril 

12 

17.0000 

16.9583 

0.7076 

Mayo 

19 

17.5833 

17.2916 

1.0988 

Junio 

25 

18.1667 

17.8750 

1.3986 

Julio 

29 




Agosto 

31 




Septiembre 

21 




Octubre 

16 




Noviembre 

18 




Diciembre 

19 





El primer paso para desarrollar un mdice estacional es calcular un promedio movil centrado. Teniendo en 
cuenta que las utilidades de Vinnie tienden a fluctuar durante el transcurso del ano y se utilizan datos mensuales, 
se calcula un promedio movil de 12 perfodos (mes). Si se requiere que analizar la actividad en las bolsas de valores 
organizadas, podrian utilizarse los datos diarios empleando un promedio movil de cinco perfodos (para los cinco 
dfas habiles) ya que, como se anoto anteriormente, la actividad en las bolsas parece depender del dfa de la semana. 

La tabla 13.7 muestra el promedio movil de 12 meses y el promedio movil centrado (PMC). Como se expreso 
anteriormente, el promedio movil de todo el ano elimina los movimientos estacionales recurrentes (debido a que 
las variaciones estacionales ocurren dentro de un ano), asf como todo efecto aleatorio durante el transcurso del 
ano. Asf, dado un modelo multiplicative Y = T • C • S ■ I, el promedio movil elimina S e I y contiene solo Ty C. Es 
decir, PM = TC. 

Ahora es posible calcular la razon por promedio movil. Para hacerlo, se divide el valor de la serie original Fpor 
el promedio movil. El resultado produce los componentes S e / de la serie de tiempo. 

Y _T X C X 5 X / o 

— T X C — S X I Razon por promedio movil 

A1 dividir los valores de la serie de tiempo por el promedio movil, se llega a la razon por promedio movil, la cual 
contiene solo componentes S e /. El componente / se eliminara en breve. 

Para resumir, se busca aislar y analizar el componente estacional. Extranamente se comienza eliminando S (e /) 
calculando el promedio movil. Luego se restaura el componente estacional calculando la razon por promedio 
movil. Estos valores tambien aparecen en la ultima columna de la tabla 13.7. 


Razon por promedio movil Al dividir los datos de la serie de tiempo por el promedio 
movil se obtiene la razon por promedio movil, que contiene los componentes S e /. 
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Ahora se debe calcular una razon media por promedio movii para cada uno de los doce meses. Esto se logra 
promediando la razon por promedio movii para cada mes tal y como se muestra en la tabla 13.8. Por ejemplo, en la 
tabla 13.7 se nota que enero tiene dos razones por promedio movii: 0.5669 para 1997 y 0.5897 para 1998. La tabla 


13.8 muestra que estos promedian 0.5669 + 0.5897/2 = 0.5783. Las razones promedio para los meses restantes se 
calculan de forma similar. Estas doce razones promedio luego se suman. De forma ideal, se sumarian hasta 12. Pero 
debido a la aproximacion y al promedio, esto es rara vez el caso. Como lo indica la tabla 13.8, la suma en realidad 
es 11.8454. 

Tabla 13.8 

(D 

(2) 

(3) 

(4) 

(5) 

(6) 

Indices estacionales 
para la utilidades de 

Mes 

1996 

1997 

1998 

Razon promedio 
por PM 

Indice estacional 
(columna 5 X 1.01305) 

Vinnie 

Enero 


0.5669 

0.5897 

0.5783 

0.5858 


Febrero 


0.6822 

0.4706 

0.5764 

0.5839 


Marzo 


0.6061 

0.5897 

0.5979 

0.6057 


Abril 


0.7164 

0.7076 

0.7120 

0.7213 


Mayo 


1.1259 

1.0988 

1.1124 

1.1269 


Junio 


1.4706 

1.3986 

1.4346 

1.4533 


Julio 

1.7373 

1.6350 


1.6861 

1.7082 


Agosto 

1.6685 

1.8191 


1.7438 

1.7665 


Septiembre 

1.1520 

1.3005 


1.2262 

1.2422 


Octubre 

0.8342 

0.8867 


0.8605 

0.8717 


Noviembre 

0.6400 

0.6502 


0.6451 

0.6535 


Diciembre 

0.6349 

0.7094 


0.6721 

0.6809 






11.8454 

11.9999—12 


Por tanto, se deben normalizar estas razones promedio para obtener un indice estacional. Esto se logra 
dividiendo 12 (debido a que hay doce perfodos) por la suma de las razones promedio por promedio movii 1 1.8454. 
El resultado es: 


12 

1 1 .8454 


1.01305 


es la razon de normalizacion. Esta razon de normalizacion se multiplica por cada una de las razones promedio para 
obtener el indice estacional para cada perfodo, tal como se observa en la tabla 13.8. Este proceso de normalizacion 
ha eliminado toda actividad irregular, dejando solo el factor estacional. 

Los usos del indice estacional son los siguientes: 

1. Despues de pasar por todos los problemas para calcular estos indices estacionales, usted estara complacido 
de saber que pueden ponerse en uso vital. Por ejemplo, el indice estacional para un mes en particular indica 
como se comporta ese mes respecto al ano como un todo. El indice de 0.5858 para enero le dice a Vinnie que las 
utilidades en enero son solo de 58.58% del promedio del ano total. Las utilidades son del 41.42% (1.000 - 
0.5858) por debajo del promedio mensual del ano. 


2. Quizas aun mas importante, los indices se pueden utilizar para desestacionalizar los datos. Esto tiene el 
efecto de eliminar la variation estacional de una serie para determinar lo que serian los valores ante la ausencia 
de variaciones estacionales. Ofrece un valor promedio por mes el que se cumpliria si no existieran cambios 
estacionales. El valor desestacionalizado se halla dividiendo el valor real durante el mes por el indice estacional 
en dicho mes. Por ejemplo, en enero de 1996, el valor desestacionalizado es: 
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10 

0.5858 


17.07 


En otras palabras, si el negocio de Vinnie no estuviere sujeto a la variacion estacional, las utilidades en enero 
de 1996 hubieran sido de US$1,707. 

Los valores desestacionalizados tambien denominados corregidos estacionalmente, porque dicen lo que 
los valores serfan si se corrigieran las influencias estacionales. El ejemplo clasico involucra las tasas de 
desempleo. Debido a que el desempleo generalmente es mayor en mayo que en la mayorfa de los otros meses, 
debido a los despidos y al influjo de muchos adolescentes en el mercado laboral, el fndice estacional para 
mayo sera mayor que 1. Si el desempleo real en mayo es de 7.2% y el fndice es 1.103, el valor desestacionalizado, 
o corregido estacionalmente, la tasa de desempleo es 7.2/1.103 = 6.53%. Esto no es lo mismo que decir que el 
desempleo fue de 6.53% (en realidad fue de 7.2%). Pero cuando se corrigen las fuerzas estacional es que inflan 
tfpicamente la tasa de desempleo en mayo, la tasa desestacionalizada es menor. De esta forma, una medida o 
fndice de variacion estacional puede utilizarse para determinar si el cambio en algunas series es mas o menos 
lo que se esperarfa, dado el comportamiento estacional tfpico. 


Valores desestacionalizados Valores obtenidos dividiendo los valores reales por sus 
indices estacionales respectivos. Reflejan como seria la variable si se eorrigiera la 
influencia estacional. 


3. Lo contrario es posible en la medida en que el fndice estacional pueda utilizarse para estacionalizar los datos 
y obtener un mejor panorama de lo que se puede generar en utilidades durante un mes. Se asume que Vinnie 
considero que las utilidades deberfan alcanzar un total de 190 durante el ano. Sin ninguna estacionalizacion, 
se puede argumentar que cada mes generarfa 190/12 = 15.83, o US$1,583 en utilidades. Sin embargo, Vinnie 
sabe que las variaciones mensuales ocurriran. Podrfa estacionalizar los datos para determinar el grado de 
dicha variacion mensual multiplicando 15.83 por el fndice estacional. El sabe que en enero las utilidades 
tienden a ser del 58.58% del total del ano. Su estimation de las utilidades para enero es (15.83)(0.5858) = 9.27, 
o US$927. 

O quizas Vinnie esta trabajando con la ecuacion de tendencia la cual, con los datos dados, seria: 

Y = 13.85 + 0.167* 

La proyeccion para enero de 1999, el perfodo de tiempo numero 37, es: 

Y = 13.85 + 0.167(37) 

= 20.03 

Sin embargo, no explica los descensos estacionales que ocurren en enero. El valor puede estacionalizarse 
multiplicando por el fndice estacional de enero, dando como resultado (20.03)(0.5858) = 11.73, lo cual 
probablemente refleja con mayor exactitud las utilidades durante dicho mes. 

La pantalla de Minitab 13.2 demuestra la impresion en Minitab para las utilidades de Vinnie. La recta de 
tendencia (la cual no se calculo aquf) se da junto con los indices estacionales. Estos difieren en algo de los 
calculos manuales en la tabla 13.8 debido a la aproximacion. Sin embargo, se nota que los indices son mayores 
que 1 para los perfodos de mayo a septiembre, justo como estaban en los calculos. 
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Pantalla en Minitab 13.2 

Time series decomposition for Vinnie's profits (Descomposicion de la serie de tiempo 
para las utilidades de Vinnie) 


Data profits 

Length 36.0000 
NMissing 0 


Data 
Length 
NMissing 
Seasonal Indices 


Trend Line Equation (Ecuacion de la recta de la tendencia) 
Yt = 13.8540 + 0 . 167053*t 


Datos 
Duracion 
N faltante 
Indices estacionales 


Seasonal Indices 


Period 

Index 

1 

0.584635 

2 

0.587189 

3 

0.612000 

4 

0.729246 

5 

1.13705 

6 

1.46259 

7 

1.70946 

8 

1.76051 

9 

1.23313 

10 

0.862486 

11 

0.646247 

12 

0.675462 


La pantalla en Minitab 13.3 representa los valores reales para las utilidades contra los valores proyectados, 
con base en la recta de tendencia. Finalmente, la pantalla en Minitab 13.4 proporciona varias representaciones. 
Los datos sin tendencia reflejan los movimientos en las utilidades si se elimina la tendencia. Se nota que las 
utilidades parecen moverse por encima y por debajo de un promedio a largo plazo entre 0.9 y 1.4. Los datos 
corregidos estacionalmente se obtienen cuando los datos reales se dividen por los indices estacionales en la 
pantalla en Minitab 13.2 como se discutio en esta section. 


Pantalla en Minitab 13.3 


Descomposicion de las utilidades 
de Vinnie 



• Real 
^ Proyectado 

Real 

Proyectado 
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Pantalla en Minitab 13.4 


Analisis de componentes respecto a las utilidades de Vinnie 
Datos originales Datos sin tendencia 



Datos corregidos estacionalmente Datos corregidos estacionalmente 


y datos sin tendencia 



Ejemplo 13.4 

Marge Spaniel ha tenido y administrado un criadero de perros durante varios anos. Ella desea 
determinar los indices estacionales para los datos trimestrales sobre los ingresos presentados aqui 
en miles de dolares en las primeras dos columnas de la tabla. 


Solucion 

Debido a que se utilizan datos trimestralmente, un promedio movil de cuatro periodos eliminara las 
variaciones estacionales. 


Trimestre del ano 

Ingreso 

PM 

PM centrado 

Razon por PM Y/CMA = S-l 

1996-1 

II 

24 

31 

29.50 



III 

21 

30.25 

29.8750 

0.7029 

IV 

42 

30.50 

30.3750 

1.3827 

1997-1 

27 

31.50 

31.0000 

0.8710 

II 

32 

31.25 

31.3750 

1.0199 

III 

25 

29.50 

30.3750 

0.8230 

IV 

41 

28.25 

28.8750 

1.4200 

1998-1 

20 

26.50 

27.3750 

0.7306 

II 

27 

26.00 

26.2500 

1.0286 

III 

18 




IV 

39 
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La suma de la razon promedio con los promedios moviles es 3.9895 como se observa en la siguiente 
tabla. La razon de normalizacion es 4/3.9895 = 1.0026 

Razones por promedio movil 


1996 1997 1998 Razon promedio por PM Indice estacional 


1 


0.8710 

0.7306 

0.8008 

0.8029 

II 


1.0199 

1.0286 

1 .0243 

1.0270 

III 

0.7029 

0.8230 


0.7630 

0.7650 

IV 

1.3827 

1.4200 


1.4014 

1.4050 





3.9895 

3.99 - 4 


Cada mdice estacional se calcula multiplicando la razon promedio por la razon de normalizacion. 
Para el trimestre I es 0.8008 X 1.0026 = 0.8029. 

Interpretacion 

Las ventas en el cuarto trimestre, por ejemplo, son 40.5% mayores que el promedio anual. El valor 
desestacionalizado para el cuarto trimestre de 1996 es 42/1.4050 = 29.89. 


B. Aislamiento de la variacion ridica 

Muchos negocios se ven afectados por las oscilaciones en el ciclo de los negocios. Cuando la economia en 
general se activa, su actividad comercial se puede acelerar, mientras que un descenso economico trae una caida 
en los negocios. Algunas industrias presentan con frecuencia movimientos en direccion opuesta del ciclo. Por 
ejemplo, la industria del entretenimiento ha sido reconocida por experimentar movimientos no ciclicos. Se supone 
que cuando las condiciones economicas empeoran, muchas personas alivian la cruel realidad escapando al cine. 

El componente ciclico puede identificarse primero obteniendo la tendencia y el componente estacional tal y 
como se describio anteriormente. Los datos del ejemplo 13.4, para el caso de la senorita Spaniel, serviran de 
ilustracion. La recta de tendencia es: 

Y, = 28.58 + 0.0524r 

Los datos originales de la serie de tiempo, los valores pronosticados con base en este modelo de tendencia y los 
indices estacionales como se determinaron en el ejemplo 13.4, se muestran en las columnas 2) , 3) y 4) de la tabla 
13.9. Por ejemplo, el valor de tendencia para el segundo periodo de tiempo, 1996-11 es 

Y = 28.58 + 0.0524(2) 

= 28.68 


Tabla 13.9 

Aislamiento 

del 

(D 

Periodo 

(2) 

Ingreso 

(3) 

Proyeccion 
de tendencia 

( 4 ) 

Indice 

estacional 

(5) 

Norma 
estadistica 
(3) X (4) 

(6) 

Componente 

ciclico-irregular 

U2)/(5)](100) 

(7) 

Componente 

ciclico 

componente 

1996-1 

24 

28.63 

0.8029 

22.99 

104.39 


ciclico 

II 

31 

28.68 

1.0270 

29.45 

105.26 



III 

21 

28.73 

0.7650 

21.98 

95.54 

103.78 


IV 

42 

28.79 

1.4050 

40.45 

103.83 

105.63 


1997-1 

27 

28.84 

0.8029 

23.16 

116.58 

108.13 


II 

32 

28.89 

1.0270 

29.67 

107.85 

109.90 


III 

25 

28.94 

0.7650 

22.14 

112.92 

105.64 


IV 

41 

29.00 

1.4050 

40.75 

100.61 

99.60 
(Conti nu a) 
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(1) 

Periodo 

(2) 

Ingreso 

(3) 

Proyeccion 
de tendencia 

M 

Indice 

estacional 

(5) 

Norma 
estadistica 
(3) X (4) 

(6) 

Componente 
ci'dico-irregular 
[(2)/(5)](1 00) 

(7) 

Componente 

ciclico 

1998-1 

20 

29.05 

0.8029 

23.32 

85.76 

93.38 

II 

27 

29.10 

1.0270 

29.89 

90.33 

88.65 

III 

18 

29.15 

0.7650 

22.30 

80.72 


IV 

39 

29.21 

1.4050 

41.04 

95.03 



Se calcula la norma estadistica multiplicando la proyeccion de tendencia por el Indice estacional. A esta se le 
denomina la norma porque representa los valores que ocurririan si solo estuvieran presentes la tendencia y las 
variaciones estacionales. 

Los componentes ciclicos e irregulares se obtienen dividiendo los datos originates por la norma estadistica, la 
cual contiene T y S. Es decir, debido a que Y=TxSxCxI 

Y TXSXCXI ^ r 

= c x I 

T X S T X S 


Luego, los resultados se multiplican por 100 para expresar la respuesta en forma de porcentaje como se mostro en 
la columna 6) de la tabla 13.9. Los valores de la columna 6) contienen tanto componentes ciclicos como irregulares. 
El ultimo se elimina tomando un promedio movil de cuatro periodos, dejando solo el factor ciclico. Esto se hace en 
la columna 7). Los valores finales de la columna 7) representan los niveles reales de ingresos de la senorita Spaniel 
para esos periodos como porcentaje de la tendencia. 

Se nota que si se utilizan los datos anuales, por definition no se tendran en cuenta las variaciones estacionales. 
El indice estacional (como se encontro en la columna 4) de la tabla 13.9, por ejemplo) seria innecesario. Los valores 
de la serie de tiempo constarian de: 

Y = TXC XI 

Los componentes C e / se encontrarian directamente al dividir solo por los valores de tendencia: 


Y 

T 


T X C X 1 

- 


— Cxi 


C. Variation irregular 

Al aislar los otros tres componentes de una serie de tiempo, se necesita decir poco sobre las variaciones irregulares. 
Es suficiente con decir que con frecuencia es posible suavizarlas y eliminarlas de manera efectiva utilizando un 
promedio movil, tal como se efectuo para la columna 7) de la tabla 13.9. 


Ejercicios de la seccion 


10 . Las exportaciones trimestrales en miles de dolares de accesorios para tuberia hacia los paises de la costa del 
patifico por parte de International Metals, Inc., se presentan a continuation. Calcule e interprete los indices 
estacionales para cada trimestre 



1995 


1997 

1 

12 

1 

10 

II 

15 

II 

15 

III 

18 

III 

14 

IV 

26 

IV 

25 


(Continue/) 
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1996 


1998 

1 

15 

1 

12 

II 

18 

II 

14 

III 

21 

III 

15 

IV 

36 

IV 

25 


11 . Los datos trimestrales para el numero de clientes de Eastern Electronics se presentan a continuacion. Compare 
la recta de tendencia y los indices para cada trimestre. 


1995 1996 1997 1998 


1 

215 

1 

366 

1 

587 

1 

621 

II 

253 

II 

471 

II 

571 

1! 

655 

III 

351 

III 

451 

III 

569 

Ill 

687 

IV 

398 

IV 

652 

IV 

588 

IV 

699 


12 . Los costos en cientos de dolares de las llamadas telefonicas internacionales realizadas por los fondos de 
inversion de Estados Unidos (USA Investment Funds) aparecen a continuacion. Calcule e interprete los 
indices trimestrales. 



1995 


1996 


1997 


1998 

1 

14 

1 

21 

1 

21 

1 

26 

II 

18 

II 

24 

II 

23 

II 

28 

III 

26 

III 

29 

III 

38 

III 

48 

IV 

15 

IV 

18 

IV 

21 

IV 

31 


13 . Desestacionalice los datos para los fondos de Inversion de Estados Unidos en el ejercicio anterior. 


13.7 El uso de los numeros indice 

En los estudios sobre las series de tiempo con frecuencia se comparan los datos en un periodo con los datos de 
un periodo diferente. Tales comparaciones deben hacerse cuidadosamente, ya que las condiciones economicas 
van cambiando con el paso del tiempo. Tales cambios dificultan el analisis de los datos comerciales o la interpretacion 
de las variables economicas. Las comparaciones directas de un periodo de tiempo con el siguiente, con frecuencia 
se tornan enganosas. 

El uso de numeros indice puede proporcionar, a quienes toman las decisiones, un panorama mas preciso del 
comportamiento de las variables economicas a traves del tiempo y hacer comparaciones a traves de periodos mas 
significativos. Un numero indice relaciona un valor en un periodo de tiempo, denominado periodo de base, con un 
valor en otro periodo, denominado periodo de referenda (o actual). 


A. Indice de precios simple 

Un indice de precios simple caracteriza la relation entre el precio de un producto o servicio en un periodo base, 
con el precio del mismo producto o servicio en el periodo de referenda. 


Indice de precios simple Indica el cambio relativo en el precio de un producto o 
servicio en el periodo de referenda, con respecto al periodo base. 
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Para calcular un indice simple se divide el precio del producto en el periodo de referencia por su precio en el 
periodo base y se multiplica por 100. 


' P 

Indice de precios simple ip r = x 100 [13.9] 

** B 


Por ejemplo, si se desea determinar el indice de precios IP para el periodo de referencia 1995 y se selecciona 1990 
como periodo de base, se tendria: 

/P1995 = x 100 

"*1990 

en donde IP es el indice de precios y P es el precio en los anos respectivos. 

Jack Nipp y su socio, Harry Tuck, poseen una planta empacadora de carne en Duluth. Los datos para sus tres 
articulos mas populares aparecen en la tabla 13.10. Nipp le dice a Tuck que calcule un indice de precios simple para 
cada producto siendo 1995 el periodo base. Utilizando la formula [13.9], Tuck encuentra que los indices de precios 
para la came en cada uno de los tres aiios son: 



y- 100 = 

'1995 

= 100 

3.00 

— X 

3.00 

100 




0*1996 = p' m X 100 = 
'1995 

= 110 

330 

3.00 

100 




0*1997 = p" 7 >< 100 = 

* 1 995 

= 150 

4.50 

X 

3.00 

100 



Tabla 13.10 




Precio/Unidad 


Datos de Nipp 

Articulo 

Unidad 

1995 

1996 

1997 

y Tuck, Inc. 

Res 

1 libra 

3.00 

3.30 

4.50 


Cerdo 

1 libra 

2.00 

2.20 

2.10 


Ternera 

1 libra 

4.00 

4.50 

3.64 


Desde el afio base de 1995 a 1996, el indice de precios incremento de 100 a 110. Tuck puede por tanto concluir 
que el precio de la came se incremento en un 10%. Esto se calcula como la diferencia entre los dos numeros indice 
dividido por el numero indice base. Es decir, 

IP\ 9% “7/^995 110 100 

/P|99 5 100 

= 10 % 


De igual forma se puede concluir que un incremento del 50% ocurrio de 1995 a 1997. 

ZP) 997 " IP\ 99s __ 150 - 100 
IP m5 “ 100 


= 50 % 
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De igual forma, se puede concluir que un incremento del 40% en el precio se presento desde 1996 hasta 1997 
debido a que el indice de precios se incremento en 40%. Sin embargo, este no es el caso. El incremento porcentual 
de 1996 a 1997 fue: 


IP mi - IP mb = 150 - 110 
^39% HO 

= 36.4% 

La diferencia del 40% entre los numeros indice en 1996 y 1997 se denomina el incremento puntual porcentual , no 
incremento porcentual. 

Se observa que el indice de precios en el ano base es siempre 100. Este sera siempre el caso ya que el precio 
en el ano base es el 100% de si mismo. 

Los indices para el cerdo y la temera se calculan de forma similar y se muestran en la tabla 13.11. Se observa 
que el indice de 1997 para la temera es menor que 100. Esto refleja el hecho de que los precios de la temera en 1997 
fueron menores de lo que fueron en el ano base de 1995. Especificamente, los precios para la ternera descendieron 
en (100 - 91) / 100 = 9% de 1995 a 1997. 


Tabla 13.11 


Articulo 1995 1996 1997 


Indices de precios 
para Nipp and Tuck 
Inc. (1995 = 100) 


Res 


3.00 

3.00 


X 


100 = 100 


3.30 
“—r X 

3.00 


100 = 110 


4.50 
3.00 X 


100 = 150 


Cerdo 

Ternera 


2.00 
2.00 X 


100 = 100 


2.20 
2.00 X 


100 = 110 


2.10 
2.00 X 


100= 105 


4.00 
4.00 X 


100 = 100 


4.50 

4.00 


X 100= 112 


3.64 

4.00 


100 = 91 


Ejemplo 13.5 

Los precios mensuales para un galon de gasolina aparecen a continuation. Utilizando marzo como 
periodo de base, calcule los indices de precios. ^Cuales fueron los incrementos porcentuales de 
marzo a mayo, y de mayo a junio? ^Cual es el incremento puntual porcentual de mayo a junio? 



Enero 

Febrero 

Marzo 

Abril 

Mayo 

Junio 

Julio 


1.79 

1.82 

1.96 

2.01 

2.10 

2.25 

2.15 

Solucion 









Indices de precios (marzo = 100) 

Mes 

Indice 

Mes 

Indice 

Enero 

S (ioo) = 91 - 3 

Mayo 

2 10 

^(100)= mi 

Febrero 

1 R9 

^100) = 92.9 

Junio 

f # 100) = 114 - 8 

Marzo 

T#i° 0 ) = 100 

Julio 

2.15, 

Y^(100) = 109.7 

Abril 

fSh o)=i ° 2 - 6 




El incremento porcentual de marzo a mayo es: 

107.1 — 100.0 


7.1% 


100.0 
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De mayo a junio el incremento porcentual es: 

114.8 - 107.1 
~ 107.1 

y el incremento puntual porcentual es de 1 14.8 - 107.1 


= 1 . 2 % 
= 1 . 1 % 


Interpretation 

El periodo de base reportara un Indice de 100. Los periodos en los cuales los valores son menores 
que el ano de base tendran un indice menor que 100, y los periodos con valores superiores al del 
ano base tendran un indice por encima de 100. 


r 

B. Indices de precios agregativos 


Con frecuencia se desea calcular un indice de precios para varios productos. Esto se denomina indice de precios 
agregativo. Las firmas que producen dos o mas articulos se interesan en los indices agregativos. Hay muchas 
agencias del gobiemo que registran graficamente el comportamiento del consumidor. El Ministerio de Trabajo de 
Estados Unidos calcula el indice de precios al consumidor, el cual mide los precios relativos para una “canasta” 
tipica de productos y servicios consumidos por el publico en general. 

El indice agregativo se calcula sumando el precio de los bienes individuales en el ano de referencia y dividiendo 
por la suma de tales precios en el ano de base. El resultado entonces se multiplica por 100. 


Indice de precios agregativo 






X 100 


[ 13 . 10 ] 


Utilizando los datos de Nipp and Tuck, se tiene que el indice agregativo de 1995 para los tres productos, manteniendo 
1995 como periodo de base, es: 


IP, 


1995 


3.00 + 2.00 + 4 .00 
3.00 + 2.00 + 4.00 °° 


100.0 


El indice para 1996 es: 


IF \ 


1996 


3.30 + 2.20 + 4.50 
3.00 + 2.00 + 4.00 


( 100 ) = 111.1 


Y para 1997 resulta: 


IP, c 


4.50 + 2.10 + 3.64 
3.00 + 2.00 + 4.00 


(100) = 113.8 


Esto significa que en 1997 se necesitarian US$113.80 para comprar los que con US$100 se comprariaen 1995. 


r 

C. Indice de precios agregativos ponderados 

Por lo menos dos problemas surgen con el uso de los indices de precios agregativos. El primero es la forma 
arbitraria con la cual se expresan las unidades. Si Nipp and Tuck hubieran fijado el precio de la came de res en 
US$1.50 por media libra, en lugar de US$3.00 por libra, el indice de precios hubiera sido completamente diferente. 
Segundo, los indices agregativos tal como se calculan, no tienen en cuenta el hecho de que algunos productos se 
venden en cantidades mayores que otros productos menos populares. No se da consideracion a las cantidades 
correspondientes de cada producto que se vende. 
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Por ejemplo, el indice agregativo calculado para Nipp and Tuck da la misma importancia o peso a la carne de 
res que a la de cerdo, aunque los clientes hayan comprado dos veces mas carne de res. Por estos motivos se 
puede querer calcular un indice de precios ponderado. Tal calculo asigna ponderaciones diferentes a los precios 
individuales. Estas ponderaciones se establecen para tener en cuenta las cantidades vendidas de cada producto. 
Esto proporciona un reflejo mas exacto del costo verdadero de la canasta tipica del consumidor. 

Las cantidades seleccionadas como ponderaciones pueden tomarse del numero de unidades vendidas en: 1) 
el perfodo base o en 2) el periodo de referenda. Dos indices comunes son el indice de Laspeyres y el indice de 
Paasche. El indice de Laspeyres utiliza cantidades vendidas en el ano de base como ponderaciones, el indice de 
Paasche se basa en las cantidades vendidas en el ano de referencia como ponderaciones. Cada procedimiento 
tiene sus propias ventajas y desventajas. 

El indice de Laspeyres utiliza las ponderaciones del periodo base (cantidades) en su calculo. El fundamento es 
que tales cantidades no cambiaran de un calculo al siguiente permitiendo por tanto comparaciones mas 
significativas con el tiempo. 


9 

Indice de Laspeyres Un indice de precios agregativo ponderado que utiliza las 
cantidades vendidas en el periodo base como factor de ponderacion. 


Para ilustrar, se consideran los datos para Nipp and Tuck de la tabla 13.12, la cual incluye tambien las cantidades 
vendidas para cada producto. El indice de Laspeyres es 


Indice de Laspeyres L = x 100 [13.11] 

2,\r b N Qg) 


en donde P R es el precio en el periodo de referencia, y P B y Q g son el precio y las cantidades vendidas en el periodo 
seleccionado como base. 


Tabla 13.12 

Nipp and Tuck, Inc. 


Tabla 13.13 

Indice de 
Laspeyres para 
Nipp and Tuck 
(1995 = 100) 






Precio/Unidad 

Cantidad vendida (100's lb) 

Articulo 

Unidad 

1995 

1996 

1997 

1995 

1996 

1997 

Res 

1 

libra 

3.00 

3.30 

4.50 

250 

320 

350 

Cerdo 

1 

libra 

2.00 

2.20 

2.10 

150 

200 

225 

Ternera 

1 

libra 

4.00 

4.50 

3.64 

80 

90 

70 





Precio 


Cantidades 


P,* °e 


Articulo 


1995 

1996 

1997 

de 1995 

P Q 

95 95 

^ 96^95 

P Q 

97 *“*95 

Carne de Res 


3.00 

3.30 

4.50 

250 

750 

825 

1,125.0 

Cerdo 


2.00 

2.20 

2.10 

150 

300 

330 

315.0 

Ternera 


4.00 

4.50 

3.64 

80 

320 

360 

291.2 







1,370 

1,515 

1,731.2 


El numerador utiliza Q B , las cantidades de cada articulo en el ano base. La tabla 13.13 muestra los calculos 
necesarios para el indice de Laspeyres utilizando 1995 como ano de base. El numerador para L se determina 
multiplicando primero cada precio por las cantidades vendidas en el periodo base de 1995. Luego el denominador 
se determina multiplicando el precio en el ano base por la cantidad en dicho ano. El indice para 1995: 
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-1995 


X(P 1995 X Q m5 ) 
2(P 1995 2 199s) 

1,370 


( 100 ) 


1,370 


( 100 ) = 100 


El fndice para 1996 utiliza los precios en el ano de referenda (1996) y las cantidades en el ano base (1995) para el 
numerador: 


_ ^2° 199ft * 2 1995) 

1996 i(p m5 x e 1995 ) 


(100) 


1995 

- ^ 515 
” 1,370 

= 110.58 


( 100 ) 


El numerador para 1997 utiliza precios en 1997 y cantidades en 1995: 

r — ^^1997 * 2 1 995) 


-1997 


2-2* 1995 ^ 2l995^ 

1,731.2 


( 100 ) 


1,370 
= 126.36 


( 100 ) 


La interpretation del indice de Laspeyres es como la de los indices anteriores. De 1995 a 1997, el precio de la 
canasta para estos tres articulos se incremento en un 26.36%. Gastaria US$126.36 en 1997 paracomprar loquecon 
US$100 compraba en 1995. 0 de manera altema, se necesitarfa US$1.26 en 1997 para comprar lo que se compraba 
con US$1.00 en 1995. 

Vale la pena notar que el denominador es el mismo en los tres anos: el indice de Laspeyres siempre utiliza 
cantidades del perfodo de base. 

Por otra parte, el indice de Paasche utiliza como ponderaciones las cantidades vendidas en cada uno de los 
varios anos de referencia. Esto tiene la ventaja de que el indice se basa en los patrones de comportamiento del 
consumidor corriente. A medida que los consumidores cambian sus habitos para comprar, estos cambios en los 
gustos del consumidor se reflejan en el indice. Los bienes que ya no atraen el interes de los consumidores, como 
BUGGY WHIPS y los sombreros de copa, no reciben mucha consideration. No obstante, utilizar diferentes 
cantidades hace posible atribuir toda diferencia en el indice a los cambios en los precios. 


Indice de Paasche Un indice de precios agregativo ponderado que utiliza como 
factor de ponderacion cantidades vendidas en el periodo de referencia. 


Su calculo es un poco mas dispendioso que el de Laspeyres: 


Indice de Paasche P = R * ^4 * 100 [13.12] 


Las cantidades para los anos de referencia aparecen tanto en el numerador como en el denominador. La tabla 13.14 
proporciona el calculo necesario para el indice de Paasche, utilizando los datos de Nipp and Tuck, con 1995 como 
ano base. Primero se multiplican los precios y las cantidades para todos los tres anos para obtener P R X Q R , lo cual 
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Tabla 13.14 

indice de Paasche 
para Nipp and Tuck 
(1995 = 100) 


Articulo 



1995 

1996 

1997 


P 

Q 

P 

Q 

P 

Q 

Came de res 

3.00 

250 

3.30 

320 

4.50 

350 

Cerdo 


2.00 

150 

2.20 

200 

2.10 

225 

Ternera 


4.00 

80 

4.50 

90 

3.64 

70 


P Q 

95 95 

P Q 

96 96 

P Q 

97 97 

P Q 

95 96 

P Q 

95 97 



750 


1,056 

1,575.0 

960 

1.050 



300 


440 

472.5 

400 

450 



320 


405 

254.8 

360 

280 



1,370 


1,901 

2,302.3 

1,720 

1,780 



se utiliza en el numerador. Tambien necesitamos el precio en el ano base, 1995, multiplicado por la cantidad para 
cada ano de referenda y obtener asi P B X Q R , que se utiliza en el denominador. El indice de Paasche para 1995 es: 


^1995 _ 


^(^95 ^ 695) 
2(P 95 X ^95) 


( 100 ) 


1,370 

1,370 


( 100 ) = 100 


Para 1996 es 


Para 1997 es 


^1996 ™ 


^(^96 ^ 895) 
2(P 95 X Q 96 ) 
1,901 


( 100 ) 


1,720 


(100) = 110.5 


1995 


X(P 97 x q 91 ) 
2 (P 95 x Q 9 7 ) 
2,302.3 


( 100 ) 


1,780 


(100) = 129.3 


La interpretation usual se aplica. 

El indice de Laspeyres requiere los datos de cantidad para un solo ano y es mas facil de calcular. Por tanto, se 
utiliza con mas frecuencia que el de Paasche. Como siempre se utilizan las cantidades del perfodo de base, se 
permiten con el tiempo mas comparaciones significativas. 

Sin embargo, el indice de Laspeyres tiende a sobreponderar los bienes cuyos precios se incrementan. Esto 
ocurre debido a que el incremento en el precio reducira las cantidades vendidas, pero la cantidad menor no se 
reflejara en el indice de Laspeyres porque utiliza las cantidades del ano base. 


Ejemplo 13.6 

El Salon Dippy Doo Hair esta considerando ajustar los precios de sus servicios. Harriet Follicle, 
gerente de Dippy Doo, desea calcular los indices de Laspeyres y de Paasche utilizando estos datos 
sobre los precios y el numero de servicios prestados. Se toma como perfodo base el mes de enero. 




Precio 



Cantidad 


Enero 

Febrero 

Marzo 

Enero 

Febrero 

Marzo 

Champu 

US$10 

US$12.00 

US$16.50 

20 

22 

25 

Corte de cabello 

8 

10.50 

9.50 

25 

20 

25 

Peinado 

12 

13.50 

14.00 

30 

31 

33 
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Solucion 


El indice de Laspeyres se basa en la siguiente tabla: 




Precio 


Cantidad 

en enero 


P„ X 0 Enero 


Enero 

Febrero 

Marzo 

Enero 

Febrero 

Marzo 

Champu 

US$10 

US12.00 US$16.50 

20 

200 

240.0 

330.0 

Corte de cabello 

8 

10.50 

9.50 

25 

200 

262.5 

237.5 

Peinado 

12 

13.50 

14.00 

30 

360 

405.0 

420.0 






760 

907.5 

987.5 


X Q,J 


e 2(P Ene X &J 

= 760 
~ 760 
= 100 


( 100 ) 


( 100 ) 


2(/>, 


^(^Feb •* Cpnc) 


Ene ^ Ozm) 

907.5 


( 100 ) 


■(100) 


^Mar 


760 

= 119.4 

^0° Mar @Ene) 


2(P Ene X g Ene ) 
987.5 


( 100 ) 


760 

129.9 


( 100 ) 


El indice de Paasche requiere otro conjunto de calculos. 




Enero 

Febrero 


Marzo 


P 

Q 

P 

Q 

P 

Q 

Champu 

10 

20 

12.00 

22 

16.50 

25 

Corte de cabello 

8 

25 

10.50 

20 

9.50 

25 

Peinado 

12 

30 

13.50 

31 

14.00 

33 


Precio por cantidad 

/> (L 

Ene Ene 


^Feb^eb 

^Mar^llar 

C4* 

^Ene^Vlar 


200 


264.0 

412.5 

220 

250 


200 


210.0 

237.5 

160 

200 


360 


418.5 

462.0 

372 

396 


760 


892.5 

1,112.0 

752 

846 




P Ene 

_ ^(^Ene * 

“ 2(P Ene x &J (100) 




760 

760 


( 100 ) 


= 100 
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/\,.K = 


( 100 ) 


P = 


■^(^Feb X Qfeb ) 

2(/g n e X C?Feb) 

892.5 
752 
118.7 

.lar X Cldar) 

S(P E „e X Q m J 
1,112 
846 


( 100 ) 


( 100 ) 


(100) - 131.4 


Interpretation 

Los dos indices generan resultados diferentes. Se basan en sistemas de ponderacion distintos. Sin 
embargo, es claro que un incremento en los precios por parte de Dippy Doo es poco sabio. Los 
precios han sido incrementados en un 29.9%, de acuerdo con el indice de Laspeyres, y 31.4% de 
acuerdo con el indice de Paasche en tan solo tres meses. 


Como se expreso anteriormente, el indice de Laspeyres tiende a sobreponderar los bienes cuyos precios 
aumentan, debido a que este incremento en el precio va acompanado de una reduccion en la cantidad, que no se 
ve reflejada en el indice de Laspeyres el cual utiliza cantidades con base fija como ponderacion. Por otra parte, el 
indice de Paasche tiende a sobreponderar los productos cuyos precios bajan. En un esfuerzo por compensar este 
hecho, el indice ideal de Fisher se sugiere en algunas ocasiones. Este indice combina los indices de Laspeyres y 
de Paasche encontrando la raiz cuadrada de su producto: 

F = VL X P 

La interpretation del indice de Fisher esta sujeta a discusion. Por este motivo, no se utiliza ampliamente. 

La tabla 13.15 proporciona una breve comparacion de las ventajas y desventajas de los indices de Laspeyres 


y de Paasche. 




Tabla 13.15 


Ventajas 

Desventajas 

Ventajas 
y desventajas 
relativas 
de los indices 
de Laspeyres 
y de Paasche 

Laspeyres 

Requiere datos de cantidad para un 
solo perfodo. Por tanto: 1) los datos 
se obtienen mas facilmente y 2) se 
puede hacer una comparacion mas 
si g n if icati va debido a que los 
cambios se pueden atribuir a los 
movimientos en precios. 

Pondera los productos cuyos precios 
aumentan. No refleja los cambios en 
los patrones de compra a traves del 
tiempo. 


Paasche 

Refleja los cambios en los habitos de 
compra debido a que utiliza los datos 
de cantidad para cada periodo de 
referencia. 

Requiere datos de cantidad para 
cada aho; estos datos con frecuencia 
son dificiles de obtener. Debido a que 
se utilizan cantidades diferentes, es 
imposible atribuir las diferencias en 
el indice solo a los cambios en precio. 
Sobrepondera los productos cuyos 
precios disminuyen. 
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13.8 Indices especi'ficos 

Numerosas agendas del gobiemo asi como el Sistema Federal de Reservas (el cual no es parte del gobiemo 
federal) y la empresa privada calculan diferentes indices para una variedad de efectos. El uso de un indice 
especifico depende de quien esta calculandolo y que factores tienen en cuenta en su formulation. Quiza la serie 
de indices mas conocida es el indice de predos al consumidor. 


A. Indice de precios al consumidor 

El indice de precios al consumidor (IPC) es reportado mensualmente por parte de la Agencia de Estadisticas 
Laborales (Bureau of Labor Statistics - BLS) del Ministerio de Trabajo de los Estados Unidos. Se presento por 
primera vez en 1914, como un medio para determinar si los salarios de los trabajadores industriales estaban acorde 
con las presiones de la inflacion que se origino por la Primera Guerra Mundial. Antes de 1978, solo habia un IPC. 
Esta medida tradicional reflejo los cambios en los precios de una canasta tipica fija de aproximadamente 400 
productos y servicios adquiridos usualmente por los trabajadores urbanos “corrientes” y de oficina. Comprendia 
aproximadamente el 40% de la poblacion total de la nacion. 

En enero de 1978, la agencia de estadisticas laborales comenzo a publicar un indice mas completo, el mdice de 
precios al consumidor para todos los consumidores urbanos. Se le denomina IPC-U, mientras que el indice 
anterior es el ICP-W. El nuevo IPC-U comprende cerca del 80% de la poblacion e incluye alrededor de 3,000 
productos de consumo que van desde los productos basicos, como alimentos, vestuario y vivienda, hasta 
provisiones para gastos en education y en entretenimiento. En 1988 ambas series de IPC cambiaron su base de 
1967 a 1982-1984. 

Tanto el IPC-W como el IPC-U emplean un sistema de ponderacion para los tipos de productos y servicios que 
los consumidores adquieren. Por ejempio, al alimento se le asigna una ponderacion o medida de importancia 
relativa de aproximadamente 18, mientras que a la vivienda se le da uno de 43. La atencion medica y el entretenimiento 
reciben cada uno una ponderacion de 5. Las ponderaciones totales para todos los bienes suman 100. Las 
ponderaciones sobre estos productos se corrigen aproximadamente cada 10 anos. De esta forma, el IPC-W y el 
IPC-U son similares para el indice de Laspeyres. Tecnicamente, el IPC difiere levemente de un indice de Laspeyres 
verdadero porque el sistema de ponderacion utilizado por el IPC no se revisa al mismo tiempo que el indice se 
cambia de base. Por tanto, el IPC algunas veces se le denomina indice de precios agregados con ponderacion 
fija. 

El IPC es altamente util para medir la inflacion, medir los cambios en valores monetarios eliminando el impacto 
de los cambios en el precio, asi en un grado limitado sirviendo como indice del costo de vida. Incluso se puede 
utilizar como instrumento para determinar los incrementos en los beneficios de seguridad social y las negociaciones 
salariales en los contratos laborales. Sus multiples usos se analizaran de forma mas completa en la siguiente 
section. 


B. Otros indices 

El indice de precios al productor IPP (anteriormente el indice de precios al mayorista) tambien se publica 
mensualmente por parte de la agencia de estadisticas laborales. Indica los cambios en los precios de los productos 
de los mercados primarios para las materias primas utilizadas en fabrication. 

El indice de produccion industrial lo presenta el sistema de Reserva Federal. No es una medida monetaria, pero 
presenta los cambios en el volumen de produccion industrial de la nacion. El periodo de base actualmente es 1977. 

Existen numerosos indices en el mercado de valores. Quiza el mas conocido es el indice de Dow Jones. Este 
indice abarca una selection de 30 acciones industriales para representar casi 1,800 acciones transadas en la Bolsa 
de Valores de Nueva York. El indice agregativo de Standard & Poor’s de 500 acciones industriales tambien es 
ampliamente observado. 
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13.9 Usos del IPC (Indice de precios al consumidor) 


Los movimientos en el IPC tienen un mayor impacto en muchas condiciones comerciales y en consideraciones 
economicas. El IPC con frecuencia se ve como una medida de la inflacion en la economia. Las tasas anuales de 
inflacion se miden por el cambio porcentual en el IPC de un ano al siguiente. El indice de inflacion de un ano a otro 
es: 


IPC, " IPC,-! 
IPC,-, 


X 100 


en donde IPC t es el IPC en el periodo t , y el IPC M es el IPC en el periodo anterior. 

La tabla 13.16 muestra el IPC de 1986 a 1997 utilizando 1982-1984 como periodo de base. Las cifras se tomaron 
del Federal Reserve Bulletin, publicado mensualmente por Board of Governors del sistema de Reservas Federales. 
La tasa de inflacion para 1987 seria por ejemplo: 


113.6 - 109.6 
109.6 


(100) - 3.6% 


Tabla 13.16 

Ano 

IPC 

Indice de inflacion (%) 

Ano 

IPC 

Indice de inflacion (°/ o ) 

IPC e indice 

1986 

109.6 


1992 

140.3 

3.0 

de inflacion 

1987 

113.6 

3.6 

1993 

145.3 

3.6 


1988 

118.3 

4.1 

1994 

148.2 

1.9 

1989 

124.3 

5.1 

1995 

152.4 

2.8 

1990 

127.2 

2.3 

1996 

156.9 

3.0 

1991 

136.2 

7.1 

1997 

158.6 

1.1 


Los cambios en el IPC tambien se toman como medida del costo de vida. Sin embargo se argumenta que tal 
practica es cuestionable. El IPC no refleja ciertos costos o gastos tales como impuestos, ni tampoco explica los 
cambios en la calidad de los productos disponibles. Ademas, el IPC no incluye algunos otros articulos valiosos 
en la estructura economica, como el aumento en el tiempo de esparcimiento por parte del trabajador promedio o las 
mejoras en la diversidad de bienes de los cuales pueden escoger los consumidores. Sin embargo, el IPC con 
frecuencia se menciona en la prensa popular como medida del costo de vida. 

El IPC con frecuencia es la base de los ajustes en las tasas salariales, los pagos del Seguro Social, e incluso en 
los contratos de alquiler y arrendamiento con option de compra. Muchos contratos laborales contienen ajustes 
del costo de vida (COLAs) que estipulan que un incremento en el IPC de una cantidad previamente acordada 
automaticamente disparara el alza en los niveles salariales de los trabaj adores. 

El IPC tambien puede utilizarse para deflactar una serie de tiempo. Deflactar una serie elimina el efecto de los 
cambios en el precio y expresa la serie en dolares constantes. Con frecuencia los economistas diferencian entre 
los dolares nominales (o corrientes) y los dolares reales (o constantes). Si una serie de tiempo tal como el ingreso 
anual durante varios anos, se expresa en terminos de dolares de 1982, se dice que dicho ingreso es un ingreso real. 
Se supone que el ingreso en dinero (nominal) es como el que se muestra en la tabla 13.17. Por ejemplo, en 1994 en 
realidad se gano US$ 42,110. Pareceria que las cosas estuvieran bien financieramente. El ingreso incremento de 
US$42,110 a US$53,500 durante dicho periodo. Sin embargo, los precios tambien han ido subiendo. Para obtener 
una medida de cuanto se ha incrementado el ingreso en terminos reales, se debe deflactar el ingreso corriente. 
Esto se logra dividiendo su ingreso en dinero por el IPC y multiplicando por 100. El resultado es su ingreso real 
expresado en dolares constantes (reales) de un ano base dado. 
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Tabla 13.17 

Ingreso monetario 
y real para los anos 

Ano 

Ingreso monetario 

IPC (1982-84 = 100) 

Ingreso n 

1994 

US$ 42,110 

148.2 

28,414 

seleccionados 

1995 

46,000 

152.4 

30,183 


1996 

49,800 

156.9 

31,739 


1997 

53,500 

158.6 

33,732 


Ingreso real Es el poder adquisitivo del ingreso monetario. 

Ingreso monetario 

Ingreso real = — X 100 


Gano US$42,110 en 1994, pero como se observa en la tabla 13.17, equivalia tan solo a US$28,414 en precios de 
1982-1984. Es decir, manteniendo estos precios constantes a nivel de 1982-1984, se esta ganando un equivalente 
de tan solo US$28,414 

Los economistas comunmente deflactan el producto intemo bruto (PIB) para obtener una medida del incremento 
de la produccion real de la nacion. El producto interno bruto es el valor monetario de todos los bienes y servicios 
finales producidos por una economia. A1 deflactar el PIB con el tiempo, los economistas eliminan todo incremento 
debido a la inflacion de los precios, y llegan a una medida del incremento verdadero en la produccion de los bienes 
y servicios disponibles para el consumo. 


PIB real Medida del valor de la produccion de la nacion en dolares constantes en algun 
periodo base; omite toda fluctuacion o variation debida a los precios cambiantes. 


PIB real = 


PIB national 
IPC 


X 100 


Ejercicios de la section 


14. Los costos de los ingredientes utilizados por Hobson Industries para fabricar dulces se presentan aqui para 
los meses seleccionados. Desarrolle y explique un indice de precios simple para cada ingrediente, utilizando 
el mes de mayo como periodo base. 

Marzo Abril Mayo Junio Julio 

Azucar US$5.12 US$5.89 US$6.12 US$6.03 US$6.29 

Base de goma 1.15 1.20 2.03 1.96 1.84 

Aceite de maiz 0.97 1.04 1.09 1.15 1.25 

15. Los precios minoristas para la sopa y las nueces se dan a continuation. Calcule el indice de precios agregativo 
para ambos productos, utilizando 1995 como periodo base. Interprete los resultados. 

1993 1994 1995 1996 1997 

Sopa US$2.03 US$2.12 US$2.35 US$2.45 US$2.50 

Nueces 0.79 0.83 0.94 1.02 1.15 
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16. Durante los ultimos tres anos en State University, la dieta de Sammy no ha sufrido cambios. Los precios y 
cantidades para los tres productos que constituyen las principales harinas de Sammy se expresan mas 
adelante. Calcule y compare el fndice de Laspeyres y el rndice de Paasche con 1997 como ano base. 




Precios 



Cantidades 


1996 

1997 

1998 

1996 

1997 

1998 

Pizza 

US$3.00 

US$4.50 

US$5.00 

500 

700 

850 

Bebida 

4.00 

4.50 

4.50 

300 

350 

400 

Galietas Pretzel 

1.50 

2.50 

3.00 

100 

100 

90 


Problemas resueltos 

1 a. Ralph Rhodes desea utilizar las tecnicas de suavizamiento para promediar y pronosticar los niveles de 
inversion de capital que su empresa ha realizado durante los ultimos anos. Calculo promedios moviles tanto 
para tres como para cuatro anos. El promedio movil de cuatro anos debe centrarse de manera subsiguiente 
debido a que contiene un numero par de terminos. 


Ano 

Inversion (US$1,000) (Y) 

PM de tres periodos 

PM de cuatro periodos 

PM de cuatro periodos centrado 

1985 

73.2 




1986 

68.1 

71 .37 



1987 

72.8 

72.27 

72.50 

72.33 

1988 

75.9 

73.50 

72.15 

72.30 

1989 

71.8 

72.33 

72.45 

71.85 

1990 

69.3 

69.70 

71.25 

70.20 

1991 

68.0 

68.27 

69.15 

68.91 

1992 

67.5 

68.47 

68.68 

69.16 

1993 

69.9 

70.20 

69.65 

70.56 

1994 

73.2 

72.80 

71.48 

72.15 

1995 

75.3 

73.80 

72.83 


1996 

72.9 





Utilizando el PM de tres periodos, 73.8 es la estimation del promedio a largo plazo alrededor del cual todas las 
observaciones tienden a caer y como tal, es el pronostico para todo periodo futuro. El PM de cuatro periodos 
produce un estimado de 72.15. 

2. Durante los ultimos anos, las condiciones del negocio para Rainbow Enterprises han sido dificiles. El CEO ha 
recolectado los totales trimestrales del numero de empleados que han sido despedidos durante los ultimos 
cuatro anos. 

a. El CEO quisiera proyectar el numero de despidos para el primer y segundo trimestres de 1998, utilizando un 
analisis de tendencia lineal. 



Para el primer trimestre de 1998, 
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Periodo 

Despldos ( Y) 

t(X) 

XY 

X 2 

1994-1 

25 

1 

25 

1 

II 

27 

2 

54 

4 

III 

32 

3 

96 

9 

IV 

29 

4 

116 

16 

1995-1 

28 

5 

140 

25 

II 

32 

6 

192 

36 

III 

34 

7 

238 

49 

IV 

38 

8 

304 

64 

1996-1 

35 

9 

315 

81 

II 

37 

10 

37Q 

100 

III 

37 

11 

407 

121 

IV 

39 

12 

468 

114 

1997-1 

38 

13 

494 

169 

II 

42 

14 

588 

196 

III 

44 

15 

660 

225 

IV 

45 

16 

720 

256 


562 

136 

5,187 

1,496 


SCx = 2X 2 


(IX ) 2 

n 


= 1,496 - 


(1 36) 2 

16 


= 340 


SCxy = IX Y - 


(£X)ffiy ) 

n 


, ,„ 7 (136X562) 

" 5 ’ 18? " " 16 

- 410 

410 
1 “ 340 

= 1.206 
b () =Y- b^C 

= 35.13 - 1.206(8.5) 

- 24.88 


Y, = 24.88 + 1.206(17) 


= 45.38 
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Para el segundo trimestre de 1998, 

Y, = 24.88 + 1.206(18) 

= 46.59 

b. El CEO ahora desea desarrollar los indices estacionales para el numero de despidos. 


Perfodo 

Despidos 

PM centrado 

Razon con PM 

1994-1 

25 



II 

27 



III 

32 

28.625 

1.1179 

IV 

29 

29.625 

0.9789 

1995-1 

28 

30.500 

0.9180 

II 

32 

31.875 

1.0039 

III 

34 

33.875 

1.0037 

IV 

38 

35.375 

1.0742 

1996-1 

35 

36.375 

0.9622 

II 

37 

36.875 

1.0034 

III 

37 

37.375 

0.9900 

IV 

39 

38.375 

1.0163 

1997-1 

38 

39.875 

0.9530 

II 

42 

41.500 

1.0120 

III 

42 



IV 

45 




El PM de cuatro periodos (debido a que se utilizan datos trimestrales) se calcula y se centra, seguido por la 
razon con PM. La razon media con PM se determina luego para cada trimestre. Debido a que las medias suman 
4.0111, la razon de normalization es 4/4.011 = 0.997. Los indices estacionales se obtienen multiplicando cada 
razon media de PM por 0.997. 



1994 

1995 

1996 

1997 

Media 

Indices estacionales 

1 


0.9180 

0.9622 

0.9530 

0.9444 

0.9416 

II 


1.0039 

1.0034 

1.0120 

1.0064 

1.0034 

III 

1.1179 

1.0037 

0.9900 


1.0372 

1.0341 

IV 

0.9789 

1.0742 

1.0163 


1.0231 

1.0200 






4.0111 

3.9991 « 4 


c. El CEO de Rainbow desea determinar los despidos si se eliminan los factores estacionales. Los niveles 
desestacionalizados de despidos para 1994-1 y 1994-11 son respectivamente, 


25 

0.9416 


— 26.55 empleados 


y 


27 __ 
1.0034 


= 26.91 empleados 



CAPITULO 13 • Seriesde tiempo ynumeros indice 45 'f 


d. Los ejecutivos de Rainbow consideran que los movimientos generates en su ciclo de negocios influyen en 
la necesidad de despedir empieados. Deciden calcular los componentes ciclicos para cada periodo de 
tiempo. 


(1) 

Periodo 
de tiempo 

(2) 

Despidos 

(3) 

Proyeccion 
de tendencias 

.(4) 

Indice 

estacional 

(5) 

Norma 

estadi'stica 

(6) 

Componente- 

irregular 

(7) 

Componente 

ciclico 

1994-1 

25 

26.08 

0.9416 

24.56 

101.80 


II 

27 

27.29 

1.0034 

27.38 

98.61 


III 

32 

28.49 

1.0341 

29.46 

108.62 

100.5 

IV 

29 

29.70 

1.0200 

30.29 

95.73 

99.61 

1995-1 

28 

30.90 

0.9416 

29.10 

96.24 

98.73 

II 

32 

32.11 

1 .0034 

32.22 

99.32 

99.01 

III 

34 

33.32 

1.0341 

34.46 

98.68 

101.51 

IV 

38 

34.52 

1.0200 

35.21 

107.92 

102.55 

1996-1 

35 

35.73 

0.9416 

33.64 

104.03 

102.01 

II 

37 

36.93 

1.0034 

37.06 

99.85 

100.06 

III 

37 

38.14 

1.0341 

39.44 

93.81 

98.15 

IV 

39 

39.35 

1.0200 

40.14 

97.17 

97.64 

1997-1 

38 

40.55 

0.9416 

38.18 

99.52 

98.34 

II 

42 

41.76 

1.0034 

41.90 

100.23 

99.33 

111 

44 

42.96 

1.0341 

44.42 

99.04 


IV 

45 

44.17 

1.0200 

45.05 

99.88 



Toman un PM de cuatro periodos de los valores ciclicos irregulares para producir justo el componente 
ciclico en la columna (7). Para 1994-III, el despido de 32 empieados representa el 100.5% de la tendencia. 

e. Si los despidos en 1998-1 son 46, ^cuantos despidos puede esperar Rainbow para 1998? Debido a que el 
primer trimestre representa tipicamente un periodo en el cual los despidos son de tan solo 94.16% del 
promedio para todo el ano, los despidos trimestrales basados en 46 para 1998-1 serian 


46 

09416 


- 48.85 


Para todo el ano, los despidos serian de un total de (48.85)(4) = 195 empieados. 

/ En un esfuerzo final por controlar el numero de despidos necesarios, los ejecutivos de Rainbow desean 
obtener cifras desestacionalizadas para cada periodo de tiempo. Elios las obtienen dividiendo el numero 
real de despidos por el indice estacional apropiado (trimestralmente). Una lista parcial de los resultados 
aparece a continuation. 


Ano-trimestre 

Despidos 

Indice estacional 

Despidos desestacionalizados 

1994-IV 

25 

0.9416 

26.55 

II 

27 

1.0034 

26.91 

III 

32 

1.0341 

30.94 

IV 

29 

1.0200 

28.43 

1995-1 

28 

0.9416 

29.74 
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3. Indices de Laspeyres y de Paasche. Su empresa fabrica tres grados de lubricantes. Los precios y cantidades 
vendidas para cada uno son las siguientes: 


Grado 


Precios 



Cantidades 


Oct. 

Nov. 

Die. 

Oct. 

Nov. 

Die. 

A 

US$3.00 

US$3.30 

US$4.00 

250 

320 

350 

B 

2.00 

2.10 

2.10 

150 

200 

225 

C 

4.00 

4.50 

3.64 

80 

90 

70 


a. Calcule el indice de Laspeyres con el mes de octubre como base. 


P Q 

Oct i)ct 

P Q 

Nov^Oct 

P Q 

'Die Oct 

750 

825 

1,125.0 

300 

330 

315.0 

320 

360 

291.2 

1370 

1,515 

1,731.2 


L = 


g(g* x q b ) 
np B x q b ) 


(100) 


Octubre: 


1370 

1370 


( 100 ) = 100 


Noviembre: 


Diciembre: 


L N = = 1 10.58 

Nov 1,370 


1 731 2 

L n . = “"“T (10°) = 12 ^ 4 
Dlc 1370 


b . Calcule el indice de Paasche con el mes de octubre como base 


C X 0^ 

^Nov ^ ^Nov 

^ X 0 Dic 

P M X 

Oct Nov 

C X O 0ic 

750 

1,056 

1,575.0 

960 

1,050 

300 

440 

472.5 

400 

450 

320 

405 

254.8 

360 

280 

1370 

1,901 

2302.3 

1,720 

1380 


P = 


g(j Pr X Qr) 
P b ^ Qr ) 


( 100 ) 


Octubre: 
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Noviembre: 

^nov = jH(lOO) = 110.52 

Diciembre: 


„ 2,302.3 . . 

■ TtsT* 100 ' 


129.34. 


Lista de formulas 


[13.1] 

r, + i-r, 

Modelo intuitivo de proyeccion 

[13.2] 

[13.3] 

F ,+ 1 = aA , + (1 - a)F, 

cme - ^ 

n ~ 1 

Proyecta el valor en una serie de 
tiempo utilizando suavizamiento 
exponencial. 

Calcula el cuadrado medio del error. 

[13.4] 


Estima la recta de tendencia 

[13.5] 

SCx = EX 2 (2X)2 
n 

Suma de cuadrados de X utilizada 
para calcular la recta de tendencia. 

[13.6] 

n 

Sumas de los productos cruzados 
de X y Y utilizadas para calcular la 
recta de tendencia. 

[13.7] 

_ SCxy 

1 ~~ SCx 

Calcula la pendiente de la recta de 
tendencia 

[13.8] 

/> 0 = Y - b x X 

Calcula el intercepto de la recta de 
tendencia. 

[13.9] 

IPr = ^X 100 

r B 

Un indice de precios simple; mide 
el cambio relativo en el precio de 
un solo producto o servicio desde 
el periodo de base hasta el periodo 
de referencia. 

[13.10] 

IP * = W B im 

Un indice de precios agregativo; 
calcula el indice de varios productos 
0 servicios. 

[13.11] 

r 1(P R X Q„) , 

a,S m 

El indice de Laspeyres utiliza como 
ponderaciones las cantidades en el 
ano de base. 

[13.12] 

„ 2(Po X Q„) / , 

f ‘ »/>: x e') <100) 

El indice de Paasche utiliza como 
ponderaciones cantidades en el ano 
de referencia. 
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Ejercicios del capi'tulo 

17 . Cars-R-Us ha reportado ventas (en US$1, 000s) durante los ultimos tres anos asi: 


Mes 

1996 

1997 

1998 

Mes 

1996 

1997 

1998 

Enero 

17.2 

18.1 

16.3 

Julio 

24.2 

23.9 

22.7 

Febrero 

18.7 

19.2 

17.3 

Agosto 

25.7 

26.2 

25.0 

Marzo 

19.7 

20.3 

18.5 

Septiembre 

21.2 

22.0 

21.9 

Abril 

20.2 

21.5 

20.3 

Octubre 

19.3 

18.0 

17.3 

Mayo 

21.7 

22.0 

21.0 

Noviembre 

22.7 

19.7 

21.2 

Junio 

23.1 

24.7 

25.0 

Diciembre 

19.3 

17.3 

16.2 


a. Grafique los datos. ^Parece que hay alguna tendencia en los datos? ^Hay alguna variacion ciclica o 
estacional? 

b. Calcule un promedio movil de 12 meses. <,Cual componente o componentes reflejan estos valores? 

18 . Calcule los indices estacionales para cada mes utilizando los datos de Cars-R-Us del ejercicio anterior. 

19 . En el ejercicio 17, /cuales son las cifras de ventas estacionales corregidas para los ultimos seis meses de 1998? 

20 . En el ejercicio 17, ^cuales son los valores desestacionalizados para los ultimos seis meses de 1998? ^Como los 
interpretaria? 

21 . Business Monthly reporto recientemente el valor en dolares de los “beneficios extra” recibidos por los 
ejecutivos durante los ultimos anos. Estos datos no incluyen dicha porcion de asistencia medica de los 
ejecutivos pagada por el patrono, y estan corregidos segun la inflation. Utilice el analisis de tendencia lineal 
para predecir el valor para el ano 2000. ,'.Ouc tan bien explica el modelo la tendencia en los niveles de 
beneficio? 


Ano 

Beneficio 

Ano 

Beneficio 

1980 

US$3,200 

1989 

US$4,280 

1981 

3,640 

1990 

4,450 

1982 

3.850 

1991 

4.500 

1983 

3,700 

1992 

4,490 

1984 

3,920 

1993 

4,560 

1985 

3,880 

1994 

4,680 

1986 

3,950 

1995 

4,790 

1987 

4,100 



1988 

4,150 




22. Los inventarios de Bake-O-Donuts durante los ultimos dos anos fueron: 
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Mes 

1995 

1996 

Mes 

1995 

1996 

Enero 

US$87 

US$95 

Julio 

US$80 

US$83 

Febrero 

93 

102 

Agosto 

73 

79 

Marzo 

102 

112 

Septiembre 

93 

84 

Abril 

112 

115 

Octubre 

102 

89 

Mayo 

93 

99 

Noviembre 

115 

92 

Junio 

82 

90 

Diciembre 

112 

91 


a. Utilice un promedio movil de 12 periodos para eliminar las variaciones estacionales. 

b. Calcule los indices estacionales. 

c. ^Cuales son los niveles de existencias corregidos estacionalmente? 

23. Mopeds, Inc., esta preocupado por la caida en las ventas. Si las ventas mensuales caen por debajo de 
US$9,000 la oficina regional del noreste debe cerrarse. Segun las cifras que aparecen a continuacion, ^es 
probable que esto ocurra dentro de los siguientes cinco meses? Las cifras estan en miles. 


1996 

E 

F 

M 

A 

M 

J 

J 

A 

S 

O 

N 

D 

18 

17.3 

16.9 

18.1 

16.8 

16.3 

15.1 

14.5 

14 

14.5 

14 

13.1 

1997 

13.9 

13.1 

12.8 

12.4 

11.8 

11.9 

11.7 

11.5 

11.1 

11.2 

11.2 

11.1 


24. Utilizando los datos del ejercicio anterior, calcule los indices estacionales. 

25. Utilizando los datos de Mopeds, Inc., ^cual es la fuerza de la relation entre las ventas y el tiempo? Represente 
la recta de tendencias para los datos reales. 

26. Dei modelo de regresion que calculo en el ejercicio sobre Mopeds, Inc., ^cual es el cambio mensual promedio 
en las ventas? 

27. John Wolf considera que el suavizamiento exponencial con un valor a de 0.8 puede proyectar mejor las 
existencias del mes de septiembre para su empresa de suministros medicos. Su hermano y socio considera 
que un valor a de 0.4 deberia utilizarse. ^Cual es el pronostico en cada caso? ^Quien esta en lo cierto, con base 
en los valores que aparecen a continuacion de existencias por mes? 


Inventarios 

E 

F 

M 

A 

M 

J 

J 

A 

(us$ioo) 

41 

48 

37 

32 

45 

43 

49 

38 


28. El unico carnicero del pueblo Three Finger Louis (Luis tres dedos), esta preocupado sobre el volumen de 
clientes morosos que debe pasar cada mes a sus cuentas incobrables. A continuacion aparecen las cantidades 
en dolares para tres anos. 
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1995 


14.1 

13.7 

12.1 

13.1 

13.5 

9.1 

7.2 

6.1 

8.7 

10.1 

11.8 

12.2 

1996 

15.2 

14.1 

13.2 

13.9 

14.0 

9.5 

7.2 

6.5 

9.1 

11.5 

12.2 

13.4 


1997 


13.7 

12.5 

11.8 

12.0 

13.0 

8.7 

6.3 

6.0 

8.2 

9.8 

10.9 

11.8 


a. Represente graficamente los datos. ^E1 factor estacional parece existir? (Considere una “estacion” como 
un mes). 

b . Utilice un promedio movil de 12 meses para suavizar la variation estacional. 

c. Calcule los indices estacionales. 

d. Desestacionalice los datos. 

e. Represente graficamente los datos originales y los datos desestacionalizados. 


29. Packer Industries esta preocupado porque las ventas pueden caer por debajo de US$100,000 en diciembre. 
Utilizando los datos que aparecen a continuation en miles de dolares, ^cual es su proyeccion? Primero 
represente graficamente los datos. 


Enero 

Febrero 

Marzo 

Abril 

Mayo 

Junio 

Julio 

Agosto 

42.7 

57.3 

68.3 

76.8 

84 

88.1 

90 

90.1 


30. U.S. News & World Report afirmo que las proyecciones realizadas por el Ministerio de Comercio de Estados 
Unidos para los ingresos medianos de los trabajadores de tiempo completo eran los siguientes 


Ano 

Ingresos (miles de dolares) 

Ano 

Ingresos (miles de dolares) 

1990 

24.28 

2020 

90.94 

1995 

30.26 

2025 

113.33 

2000 

37.71 

2030 

171.23 

2005 

47.00 

2035 

176.00 

2010 

58.56 

2040 

219.33 

2015 

73.00 




a. Represente graficamente los datos 

b. Calcule el modelo de tendencia 

c. ^Cual es la proyeccion para el ano 2050? 
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31. Milles Products registro las utilidades que aparecen en la tabla. 

a. Utilice el suavizamiento exponencial para pronosticar las utilidades futuras. Primero, fije a = 0.2, luego en 
0.9. 

b. ^Que valor a produce una estimation mas confiable? 

c. ^Como hubiera podido conocer esto de antemano? 


Semana 

1 

2 

3 

4 

5 

6 

7 

Utilidades (US$1,000) 

10 

25 

3 

15 

2 

27 

5 


32. Los datos sobre el consumidor suministrados por el Ministerio de Comercio de Estados Unidos para el 
verano de 1998 revelaron lo siguiente: 



Unidad 


Precios 


1996 

1997 

1998 

Came de res 

1 Libra 

US$3.12 

US$3.89 

US$3.92 

Leche 

1 Galon 

2.10 

2.42 

2.51 

Polio 

1 Libra 

1.95 

2.10 

2.12 

Pan 

1 Molde 

0.99 

0.89 

1.12 


Calcule e interprete el rndice simple para cada producto utilizando 1996 como periodo base. 

33. Dados los datos del problema anterior, calcule: 

a. El incremento porcentual en el precio de cada producto para: 

1996 a 1997 

1996 a 1998 

1997 a 1998 

b. El incremento puntual porcentual para cada producto para: 

1996 a 1997 

1996 a 1998 

1997 a 1998 

34. A continuation se presentan los costos de la estadia de un solo dia en el hospital. Utilice 1993 como aho base 
y calcule el mdice simple. Interprete el indice obtenido para 1990. 


1990 

1991 

1992 

1993 

1994 

1995 

US$356 

US$408 

US$512 

US$589 

US$656 

US$689 
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35. Sammy Studd desea comprar todo un guardarropa completo de ropa de atletismo para el verano. El ha 
recolectado los datos que aparecen a continuation y se sorprende de como han cambiado los precios durante 
los ultimos tres anos. Calcule e interprete el indice de precios agregativo para los cuatro productos, utilizando 
1996 como ano base. 



1996 

1997 

1998 

Zapatos 

US$89.90 

US$115.12 

US$125.00 

Sudaderas 

52.50 

65.50 

75.50 

Pantalonetas 

25.75 

35.95 

45.90 

Medias 

12.10 

10.00 

9.50 


Los precios de una nueva linea de munecas de juguete producidas por The Krazy Kid Kollection aparecen a 
continuation. Utilizando 1994-1995 como periodo base, calcule un indice de precios simple para los tres 
juguetes: 


1994 

1995 

1996 

Killer Joe 

US$17.90 

US$21.50 

US$25.00 

Pyro Phil 

15.00 

25.00 

29.95 

Maniac Mark 

10.00 

11.00 

12.00 


37. Bell Electronic desea analizar los cambios en los precios para tres de sus productos durante los ultimos tres 
anos. Aqui se proporcionan los datos necesarios: 


Producto 


Precios 



Cantidades 


1996 

1997 

1998 

1996 

1997 

1998 

A 

US$10.00 

US$15.50 

US$20.00 

150 

170 

160 

B 

3.00 

5.00 

7.50 

55 

68 

120 

C 

69.00 

75.00 

75.00 

100 

90 

85 


38. Calcule e interprete los indices de Laspeyres y de Paasche utilizando 1996 como periodo base. Usando los 
datos del ejercicio anterior calcule el indice de Fisher. 

39. Pam McGuire, director de operaciones de Columbia Records, compilo los siguientes datos sobre los costos 
de grabacion y el numero de veces que se utilizo cada articulo durante los ultimos tres anos para tres articulos 
que se utilizan comunmente en el negocio de grabacion. 




Costo por uso 


Frecuencia de uso 

1996 

1997 

1998 

1996 

1997 

1998 

Costos de estudio 

US$120 

US$145 

US$165 

30 

35 

37 

Equipo de grabacion 

420 

530 

620 

40 

43 

46 

Acompahamiento 

300 

250 

250 

50 

63 

72 
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Sam O’Donnell, director de procedimientos estadisticos, debe calcular un indice de Laspeyres y un indice de 
Paasche, utilizando 1996 como base, y luego debe determinar la tasa en la cual se han incrementado los costos 
cada ano bajo ambos indices, asi como la tasa de inflacion durante los tres anos. 

40 . Del ejercicio 39, /cual indice es el que probablemente mide mejor el incremento en los costos de Columbia? 
( ',Por que? Sustente su respuesta. 

41 . Just Pizza compro las cantidades de ingredientes a los precios que aparecen en la siguiente tabla. Janet 
Jackson, gerente de Just Pizza, esta preocupada por el incremento en los precios. Desarrolle los indices de 
Laspeyres y de Paasche para Janet, utilizando enero como base. 




Precio/Libra 


Libras utilizadas (100's) 


Enero 

Febrero 

Marzo 

Abril 

Enero 

Febrero 

Marzo 

Abril 

Queso 

2.10 

2.15 

2.20 

2.25 

10 

12 

15 

12 

Peperoni 

1.18 

1.20 

1.25 

1.31 

8 

10 

8 

10 

Salchichas 

1.25 

1.31 

1.35 

1.42 

7 

6 

7 

7 


42 . Utilizando los datos de Janet del ejercicio anterior, /,el indice de Paasche muestra la tasa a la cual los precios 
incrementan o disminuyen? 


Ejercicios por computador 

Spark Industries ha estado experimentando una cafda en ias utilidades durante los ultimos anos. Mientras que el 
precio de sus productos ha permanecido estable, el numero de empleados necesarios para mantener la produccion 
ha presentado una tendencia alcista pronunciada, haciendo que los costos laborales incrementen dramaticamente. 

Para refrenar esta tendencia indeseable, usted ha sido encargado de analizar los niveles de precios de Sparks 
y el numero de empleados. Ingrese al archivo SPARK en su disco de datos. Contiene 50 observaciones de datos 
trimestrales para el precio minorista de su producto (PRICE) y para el numero de empleados (EMPL). 

Usted debe utilizar tecnicas de suavizamiento para proyectar los precios futuros y proporcionar una 
descomposicion completa de los datos de series de tiempo para los empleados. Prepare sus hallazgos en un 
reporte estadistico como se describe en el apendice I. 



En la seccion Escenario, a comienzos de este capftulo, se importancia considerable a la planeacion cuidadosa y al 
explico como el senor Dickson utiliza el analisis estadistico tiempo de sus operaciones. 
en la toma de decisiones. Como propietario y CEO da una 
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El senor Dickson le ha contratado como consultor 
estadistico externo para que le proporcione valiosa 
information sobre su negocio, la cual el considera sera de 
gran utilidad en la formulation de planes futuros. 
Especificamente, su tarea es predecir las utilidades 
utilizando un promedio movil de cuatro periodos con base 
en los datos que se presentan mas adelante. 

Ademas, usted debe comparar esta proyeccion a la 
obtenida a traves del suavizamiento exponencial. El Sr. 
Dickson no ha especificado un valor a para la constante de 
suavizamiento y espera que usted determine cual valor es 
optimo. 


Periodo 

de tiempo 

Utilidades 

(US$00) 

Ingresos 

(US$000) 

Periodo 

de tiempo 

Utilidades 

(US$00) 

Ingresos 

(US$000) 

1995-1 

25 

10 

1997-1 

32 

25 

II 

29 

12 

II 

28 

20 

III 

24 

15 

III 

33 

26 

IV 

28 

14 

IV 

31 

32 

1996-1 

31 

17 

1998-1 

24 

34 

II 

27 

19 

II 

35 

38 

III 

24 

17 

III 

28 

41 

IV 

28 

21 

IV 

25 

45 


Finalmente, las ventas de la empresa tambien son una 
gran preocupacion para el Sr. Dickson. Dados los datos 
suministrados aqui, usted debe desarrollar e interpretar 
una recta de tendencia asf como tambien descomponer las 
series de tiempo, desglosando cada componente 
individualmente. Presente su reporte final al Sr. Dickson 
en forma de reporte estadistico como se describe en el 
apendice I. Incluya todos los resultados relevantes asi 
como su interpretation. 


Del escenario a la vida real 

El Sr. Dickson, el propietario industrial mencionado en la section Escenario a comienzos del capi'tulo, considera 
que los cambios en el clima economico global afectan los valores de sus utilidades y los ingresos por concepto de 
ventas. De hecho, podria investigar el grado en el que la economia en general afecta el valor de sus utilidades, 
ajustandolas a los cambios en el nivel de precios global, utilizando el IPC (indice de precios al consumidor) 
publicado por el Ministerio de Trabajo de Estados Unidos. Tambien puede comparar sus niveles de ventas tanto 
con el producto intemo bruto (PIB) como con las ventas finales de todos los productos terminados de Estados 
Unidos, utilizando los indices publicados por el Ministerio de Comercio de Estados Unidos. 

Estos indices estan disponibles en Internet. Para localizar los datos del IPC, se dirige hacia el sitio de estadisticas 
del Ministerio de Trabajo ( http:/stats.bls.gov:80 /). Una vez alii, se selecciona el area de “Data” (Datos). Luego se 
hace clic en “Most Requested Series” (Serie mas solicitada). En la pagina siguiente, haga clic en “Overall Most 
Requested Series (Series mas solicitadas en total). La siguiente pagina permite seleccionar el indice, los anos 
abarcados, y el formato de entrega de datos que se desee. Desplacese hacia abajo hacia el encabezado “Price 
Indexes” (Indice de precios) y seleccione IPC para todos los Consumidores Urbanos 1982-1984 = 100. Mas 
adelante en esta pagina, escoja los anos para su analisis, por ejemplo 1987-1997. Por ultimo, en esa misma pagina, 
seleccione la tabla de su escogencia bajo el encabezado “Format” (Formato). Esto completa su solicitud de datos. 
Haciendo clic en “Retrieve” (Recuperar) se producen los datos del IPC que le interesan. 
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PIB y ventas finales de productos se encuentran en el sitio del Ministerio de Comercio (j http://www.doc.gov ). 
En el home page (pagina de presentation haga clic en “Commerce Web Sites (ordenados por agenda)”. Luego 
haga clic en “Bureau of Economic Analysis - BEA (Agencia de Analisis Economico). Haga clic en “National”. 
Desplacese hacia el encabezado “Historical time series” (Serie de tiempo historico) y haga clic en “Tables” 
(Tablas). Alii se puede decidir si hacer clic en “GDP and final sales, annually” (PIB y ventas finales, anualmente) 
o “GDP and final sales, Quarterly” (PIB y ventas finales trimestralmente) para los datos de su interes. 




Prueba chi-cuadrado 
y otras pruebas 
no parametricas 


Plan del capitulo 

Muchas de las pruebas que se estudiaron en ios capftulos anteriores requirieron de supuestos basicos antes que 
se pudiera realizar la prueba. Se asume que la poblacion estaba distribuida normalmente o que las varianzas se 
ajustaban a patrones particulares. Cuando tales supuestos no pueden hacerse, o no se logra el conocimiento 
esencial sobre la poblacion, se tiene que confiar en las pruebas no parametricas analizadas en este capitulo. 
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E S C E 

Durante muchos anos la pizzeria de Mama ha sido un sitio 
muy frecuentado por los estudiantes de una universidad 
cercana. Sin embargo, este aiio Mama ha enfrentado una 
fuerte competencia de Dante, un nuevo negocio que abrio 
al otro lado del campus. Dante ofrece un extenso menu que 
atrae a muchos estudiantes interesados en probar nuevos 
platos. 

Mama decidio ampliar su selection para no perder sus 
clientes en manos de la competencia que ha incursionado 
en el mercado y el cual habfa sido exclusivamente suyo. 
Mama reconoce que necesitara tomar muchas decisiones 
delicadas que solo pueden tomarse despues de considerar 
las consecuencias. 



N A R I 0 



esta generosa propuesta, usted decide proporcionar a Mama 
el mejor consejo posible. 


Para tomar tales decisiones. Mama le ha contratado a 
usted como asistente estadistico para analizar el mercado, 
evaluar las altemativas y disenar un plan para ganar de 
nuevo su prominencia como proveedor principal de las 
necesidades que tienen los estudiantes de harina. Usted se 
da cuenta que esta tarea importante necesitara de su 
experiencia en estadistica en toda su extension. 

Mama acepta pagarle con alimento y bebida durante el 
resto del semestre si usted puede ayudarle. Estimulado por 


Despues de pensarlo cuidadosamente, usted decide 
que datos debe recolectar, como debe organizarlos y que 
pruebas exactas utilizara para proporcionar a Mama la 
information necesaria para tomar tales decisiones. Usted 
tambien es consciente de que los supuestos necesarios 
para realizar las pruebas estadisticas que ha estudiado 
hasta el momento ya no son validos y que esta tarea exigira 
que confie en las pruebas no parametricas que se estudian 
en este capitulo. 


14.1 Introduction 

Los capitulos anteriores presentaron muchas pruebas de hipotesis. Se realizaron pruebas tanto para las medias 
poblacionales como para las proporciones poblacionales. En algunos casos el tamaho de la muestra era mayor 
que 30, mientras que en otras la muestra era pequena. Se analizaron las pruebas para una sola poblacion y las 
pruebas que comparaban dos o mas poblaciones. 

Sin embargo, todas estas situaciones de pruebas presentaron una caracteristica comun: necesitaban de 
ciertos supuestos respecto a la poblacion. Por ejemplo, las pruebas t y las pruebas F requerian el supuesto de que 
la poblacion estuviese distribuida normalmente. Debido a que tales pruebas dependen de postulados sobre la 
poblacion y sus parametros, se denominan pruebas parametricas. 

En la practica, surgen muchas situaciones en las cuales simplemente no es posible hacer de forma segura 
ningun supuesto sobre el valor de un parametro o sobre la forma de la distribucion poblacional. La mayorfa de las 
pruebas descritas en los capitulos anteriores no son aplicables. Mas bien se deben utilizar otras pruebas que no 
dependan de un solo tipo de distribucion o de valores de parametros especificos. Estas pruebas se denominan 
pruebas no parametricas (o libres de distribucion). Este capitulo analiza varias de estas herramientas estadisticas. 
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Pruebas no parametricas Son procedimientos estadisticos que pueden utilizarse 
para contrastar hipotesis cuando no son posibles los supuestos respecto a los parametros 
o a las distribuciones poblacionales. 


14.2 Distribucion chi-cuadrado (% 2 ) 

Una de las herramientas no parametricas mas utiles es la prueba chi-cuadrado (% 2 ). A1 igual que la distribucion t, 
la distribucion chi-cuadrado es toda una familia de distribuciones. Existe una distribucion chi-cuadrado para cada 
grado de libertad. La figura 14.1 muestra que a medida que se incrementa el numero de grados de libertad, la 
distribucion chi-cuadrado se vuelve menos sesgada. Las dos aplicaciones mas comunes de chi-cuadrado son 1) 
pruebas de bondad de ajuste y 2) pruebas de independencia. Se analizaran a su tiempo. 



A. Pruebas de bondad de ajuste 

Con frecuencia, las decisiones en los negocios requieren que se pruebe alguna hipotesis sobre la distribucion 
poblacional desconocida. Por ejemplo, se puede plantear la hipotesis que la distribucion poblacional es uniforme 
y que todos los valores posibles tienen la misma probabilidad de ocurrir. Las hipotesis que se probarfan son: 

H g : La distribucion poblacional es uniforme. 
f/ A : La distribucion poblacional no es uniforme. 

La prueba de bondad de ajuste se utiliza entonces para determinar si la distribucion de los valores en la poblacion 
se ajusta a una forma en particular planteada como hipotesis -en este caso, una distribucion uniforme. De la 
misma manera que con todas las pruebas estadfsticas de esta naturaleza, los datos muestrales se toman de la 
poblacion y estos constituyen la base de los hallazgos. 


Pruebas de bondad de ajuste Medidas sobre que tan cerca se ajustan los datos 
muestrales observados a una forma de distribucion particular planteada como hipotesis. 
Si el ajuste es razonablemente cercano, puede concluirse que si existe la forma de 
distribucion planteada como hipotesis. 
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Si existe gran diferencia entre lo que realmente se observa en la muestra y lo que se esperarfa observar si la 
hipotesis nula fuera correcta, en tal caso es menos probable que la hipotesis nula sea verdadera. Es decir, la 
hipotesis nula debe rechazarse cuando las observaciones obtenidas en la muestra difieren mucho del patron que 
se espera que ocurra si la distribucion planteada como hipotesis si se presenta. 

Por ejemplo, si se hace rodar un dado bueno, es razonable plantear como hipotesis un patron de resultados tal 
que cada resultado (numeros del 1 al 6) ocurra aproximadamente un sexto de las veces. Sin embargo, si un 
porcentaje significativamente grande o significativamente pequeno de numeros pares ocurre, puede concluirse 
que el dado no esta balanceado adecuadamente y que la hipotesis es falsa. Es decir, si la diferencia entre los 
patrones de eventos que en realidad se observaron y el patron de eventos que se espera que ocurra si la hipotesis 
nula es correcta, prueba ser demasiado grande como para atribuirlo a un error de muestreo, y debe concluirse que 
la poblacion presenta una distribucion distinta de la especificada en la hipotesis nula. 

Para contrastar la hipotesis relativa a una distribucion poblacional, se debe analizar la diferencia entre las 
expectativas con base en la distribucion planteada como hipotesis y los datos reales que aparecen en la muestra. 
Esto es precisamente lo que hace la prueba chi-cuadrado de bondad de ajuste. Determina si las observaciones 
muestrales “se ajustan” a las expectativas. La prueba toma la siguiente forma: 


Prueba ehi-euadrado 

* (O, - Ef 
£ £, 

[14.1] 





en donde O es la frecuencia de los eventos observados en los datos muestrales 

i 

E. es la frecuencia de los eventos esperados si la hipotesis nula es correcta 
K es el numero de categorfas o clases 

La prueba tiene K-m- 1 grados de libertad, en donde m es el numero de parametros a estimar. El impacto 
exacto de m sera mas evidente a medida que la discusion progrese. 

Vale la pena notar que el numerador de la formula [14. 1] mide la diferencia entre las frecuencias de los eventos 
observados y las frecuencias de los eventos esperados al cuadrado. Cuando estas diferencias son grandes, 
haciendo que % 1 2 se incremente, deberfa rechazarse la hipotesis nula. 


1. Prueba para un ajuste uniforme Chris Columbus, director de mercadeo de Seven Seas, Inc., tiene la 
responsabilidad de controlar el nivel de existencias para cuatro tipos de botes vendidos por su firma. En el pasado 
ha ordenado nuevos botes bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada 
tipo es la misma. Sin embargo, recientemente las existencias se han vuelto mas dificiles de controlar, y Chris 
considera que deberfa probar su hipotesis respecto a una demanda uniforme. Sus hipotesis son: 

H Q : La demanda es uniforme para los cuatro tipos de botes. 

H a : La demanda no es uniforme para los cuatro tipos de botes. 

Suponiendo uniformidad en la demanda, la hipotesis nula presume que de una muestra aleatoria de botes, los 
navegantes de fin de semana comprarfan un numero igual de cada tipo. Para probar esta hipotesis, Chris selecciona 
una muestra de n = 48 botes vendidos durante los ultimos meses. Si la demanda es uniforme, puede esperar que 
48/4 = 12 botes de cada tipo se vendan. La tabla 14.1 muestra esta expectativa junto con el numero de cada tipo que 
en realidad se vendio. Se nota que S(0.) = £(£). Chris debe determinar ahora si los numeros vendidos realmente 
en cada una de las categorfas K - 4 esta lo suficientemente cerca de lo que se esperarfa si la demanda fuese 
uniforme. La formula [14.1] da 
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2 (15 - 12) 2 (11 — 12) 2 (10 — 12) 2 (12 — 12) 2 

4 12 12 12 12 
= 1.17 

El valor 1 . 17 se compara con un valor crftico de % 2 tornado de la tabla H en el apendice III. Debido a que no existen 
parametros que tengan que estimarse, m = 0 y hay K- 1=3 grados de libertad. Si Chris deseara probar al nivel del 
5%, se encontrarfa, como lo muestra la figura 14.2, que % 2 0053 = 7.815. 

Regia de decision: “No rechazar si % 2 <7.815. Rechazar si % 2 > 7.815”. 

Gracias a que 1 . 17 < 7.8 15, la hipotesis nula de que la demanda es uniforme no se rechaza. Las diferencias entre lo 
que se observo en realidad, <9., y lo que Chris esperaba observar si la demanda fuera la misma para los cuatro tipos 
de botes, E., no son lo suficientemente grandes como para refutar la hipotesis nula. Las diferencias no son 
significativas y pueden atribuirse simplemente a un error de muestreo. 


Tabla 14.1 

Registro de ventas 
de Seven Seas 


Tipo de bote 

Ventas observadas [ 0 ) 

Ventas esperadas (£] 

Pirates' Revenge 

15 

12 

Jolly Roger 

11 

12 

Bluebeard's Treasure 

10 

12 

Ahab's Quest 

12 

12 


48 

48 


Figura 14.2 

Prueba chi-cuadrado 
(X 2 ) para Seven Seas 



Puede utilizarse Minitab para realizar estos calculos. Simplemente ingrese los datos para las frecuencias 
observadas en la primera columna y los datos de las frecuencias esperadas en la segunda. En la ventana de 
sesiones, digite: 


MTB> LET Kl = SUM ( (Cl - C2 ) **2/C2) 
MTB> PRINT Kl. 


La primera lmea le dice a Minitab que calcule la formula [ 14. 1 ] . La segunda le pide a Minitab reportar el estadistico 
chi-cuadrado. Utilizando los datos de los botes de Chris, se devuelve el valor de 1.16667. 
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El valor p para la prueba es el area que esta a la derecha de los hallados muestrales de 1 . 17, tal como se observa 
en la figura 14.2. Se puede observar solamente que es mayor al 5%. Minitab tambien calculara el valor p mediante 


MTB> CDF K1 K2 ; 

SUBC> CHISQUARE 1. 

MTB> LET K3 = 1 - K2 
MTB> PRINT K3 . 

Minitab le devolvera el valor p de 0.280087. 

2. Prueba de ajuste a un patron espedfico En el ejemplo de los botes, Chris asumio que la demanda de los cuatro 
tipos era la misma. Los valores para las frecuencias esperadas eran por ende las mismas. Sin embargo, surgen 
muchos casos en los cuales las frecuencias se prueban contra un patron determinado, en el cual las frecuencias 
esperadas no son todas iguales. En su lugar deben determinarse asf: 


Frecuencias esperadas E i = n Pt [14.2] 


en donde n es el tamano de la muestra 

p. es la probabilidad de cada categorfa como se especificd en la hipotesis nula 

El ejemplo 14. 1 lo muestra. 


Ejemplo 14.1 

El John Dillinger First National Bank, en Nueva York, trata de seguir una polftica de extender un 60% 
de sus creditos a empresas comerciales, unl0% a personas naturales y un 30% a prestatarios 
extranjeros. 

Para determinar si la polftica se estaba siguiendo, Jay Hoover, vicepresidente de mercadeo, 
selecciona aleatoriamente 85 creditos que se aprobaron recientemente. Encuentra que 62 de tales 
creditos se otorgaron a negocios, 10 a personas naturales, y 13 a prestatarios extranjeros. Al nivel 
del 10%, ^parece que el patron de cartera deseado se preserva? Pruebe la hipotesis de que 

Se mantuvo el patron deseado: 60% son creditos comerciales, 10% son 
prestamos personales y 30% son creditos extranjeros. 

// A : El patron deseado no se mantuvo. 

Solution 

Si la hipotesis nula es correcta, el Sr. Hoover esperarfa que el 60% de los 85 creditos de la muestra sean 
creditos comerciales. De manera que para la primera categorfa, E. = np . = (85)(0.60) = 51 creditos 
comerciales. Ademas, esperarfa que (85)(0.10) = 8.5 de los creditos fueran otorgados a personas 
naturales y (85)(0.30) = 25.5 creditos a clientes extranjeros. Los datos se resumen en la siguiente tabla. 


Tipo de credito 

Frecuencias observadas (£7) 

Frecuencias esperadas (£) 

Comercial 

62 

51.0 

Personal 

10 

8.5 

Extra njero 

13 

25.5 


85 

8R0 
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El valor es 


2 (62 - 51) 2 , (10 - 8.5) 2 (13 - 25. 5) 2 

x = — — — + - — — + — — 

51 8.5 25.5 

- 8.76 

De nuevo, no se estimaron parametros y m = 0. Con a al 10% y K = 3 categories de credito 
(comerciales, privados y extranjeros), existen 1 o 3 -0- 1 = 2 grados de libertad. El Sr. 

Hoover encuentra de la tabla H del apendice III que el valor critico de % 2 0 102 = 4.605. 

Regia de decision: u No rechazar la hipotesis nula si % 2 < 4.605. Rechazar 
si la hipotesis nula % 2 > 4.605”. 

Como lo muestra la figura, la hipotesis nula deberfa rechazarse debido a que 8.76 > 4.605. 



Interpretation 

Las diferencias entre lo que el Sr. Hoover observo y lo que esperaba observar si el patron de credito 
deseado se alcanzaba era demasiado grande como para ocurrir por simple azar. Existe solo un 10% 
de probabilidad de que una muestra de 85 creditos seleccionados aleatoriamente pudieran producir 
las frecuencias observadas aqui demostradas, si el patron deseado en la cartera de credito del 
banco se estuviera manteniendo. 


3. Prueba de normalidad Las especificaciones para la produccion de tanques de aire utilizados en inmersion 
requieren que los tanques se llenen a una presion promedio de 600 libras por pulgada cuadrada (psi). Se permite 
una desviacion estandar de 10 psi. Las especificaciones de seguridad permiten una distribucion normal en los 
niveles de llenado. Usted acaba de ser contratado por Aqua Lung, un importante fabricante de equipos de 
inmersion. Su primera tarea es determinar si los niveles de llenado se ajustan a una distribucion normal. Aqua 
Lung esta seguro de que la media de 600 psi y la desviacion estandar de 10 psi prevalecen. Solo queda por probar 
la naturaleza de la distribucion. En este esfuerzo se mide n = 1 ,000 tanques y se halla la distribucion presentada en 
la tabla 14.2 Sus hipotesis son: 

H 0 : Los niveles de llenado estan distribuidos normalmente. 

//* Los niveles de llenado no estan distribuidos normalmente. 

A 

Igual que antes, la prueba requiere comparar estas observaciones reales con las que usted esperaria encontrar si 
prevaleciera la normalidad. Para determinar estas frecuencias esperadas, usted debe calcular las probabilidades 
de que los tanques seleccionados aleatoriamente tengan los niveles de contenido en los intervalos presentados 
en la tabla 14.2. La probabilidad de que un tanque caiga en el primer intervalo es P(0 < X < 580). El problema que 
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Tabla 14.2 

PSI 

Frecuencia 

Niveles de llenado para 

0 y por debajo de 580 

20 

los tanques de buceo 

580 y por debajo de 590 

142 


590 y por debajo de 600 

310 


600 y por debajo de 610 

370 


610 y por debajo de 620 

128 


620 y por encima 

30 



1,000 


se enfrenta esta representado en la figura 14.3(a). Usted debe determinar el area sombreada bajo la curva. Asf: 


a 

„ 580 - 600 

z = “ W~ 


= -2, o un area de 0.4772 


Entonces 

P { 0 < X < 580) = 0.5000 - 0.4772 = 0.0228 

Existe un poco mas del 2% de probabilidad de que ningun tanque seleccionado aleatoriamente tenga un nivel 
inferior a 580 psi si los contenidos promedio son de 600 psi con una desviacion estandar de 10 psi y estan 
distribuidos normalmente. Para el segundo intervalo, la probabilidad de que un tanque seleccionado aleatoriamente 
tenga un nivel de contenido entre 580 y 590 es P ( 580 < X < 590), y se presenta en la figura 14.3 (b). 


Entonces 


_ 580 ~ 600 
10 

= —2, o un area de 0.4772 
_ 590 - 600 
10 

= — 1, o un area de 0.3413 


P { 580 < X < 590) = 0.4772 - 0.3413 = 0.1359 

Figura 14.3 Probabilidades de los contenidos de los tanques 
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Las probabilidades de los intervalos restantes se calculan de forma similar y se muestran en la tabla 14.3, junto con 
las frecuencias esperadas. Igual que antes, las frecuencias esperadas son £. = np.. Para el primer intervalo este se 
convierte en (1,000)(0.0228) = 22.8. Se desea probar la hipotesis al nivel del 5%. Debido a que tanto la media 
poblacional como la desviacion estandar son dadas y no tienen que estimarse, m = 0. Existen K = 6 clases en la 
tabla de frecuencias, de manera que los grados de libertad son K - 1 = 5. Se encuentra que el valor critico % 2 es 
y 2 =11 07. 

A 0.05,5 1 1 


Tabla 14.3 

Probabilidades 
de los niveles 

PSI 

Frecuencia real (O) 

Probabilidades [p) 

Frecuencia esperada(£p 

0 y por debajo de 580 

20 

0.0228 

22.8 

de llenado 

580 y por debajo de 590 

142 

0.1359 

135.9 


590 y por debajo de 600 

310 

0.3413 

341.3 


600 y por debajo de 610 

370 

0.3413 

341.3 


610 y por debajo de 620 

128 

0.1359 

135.9 


620 y por encima 

30 

0.0228 

22.8 



1,000 

1.0000 

1000.0 


Regia de decision: “No rechazar la hipotesis nula si % 2 es menor que 1 1.07. Rechazar la hipdtesis 
nula si % 2 es mayor que 1 1.07”. 

Utilizando la formula [14. 1] se tiene que 


.2 _ 


(20 - 22.8) 1 , (142 - 135.9) 2 

4* 7 4~ 


21.5 


135.9 


+ 


(30 - 22.8) 2 
21.5 


= 8.63 


Como se muestra en la figura 14.4, la hipotesis nula no deberfa rechazarse. Las diferencias entre lo que se observo 
y lo que se espera observar si los contenidos estuvieran distribuidos normalmente con una media de 600 y una 
desviacion estandar de 10 pueden atribuirse al error de muestreo. 


Figura 14.4 

Prueba chi-cuadrado 
de normalidad 



Si la media poblacional y la desviacion estandar no fueran conocidas, se hubieran tenido que estimar de los 
datos muestrales de la tabla 14.2. Entonces m sena 2, y los grados de libertad serfan £- 2 - 106 - 2 - 1 = 3 . 

Advertencia : La prueba chi-cuadrado de bondad de ajuste es confiable solo si todo E. es por lo menos 5. Si una 
muestra tiene un E. < 5, debe combinarse con clases adyacentes para garantizar que todas las categorfas E. > 5. Si 
se ha seleccionado una muestra de tan solo n = 100 en lugar de 1,000 tanques de inmersion, el E { para la primera 
clase hubiese sido E. = np. = (100)(0.0228) = 2.28 en lugar de 22.8. Esta primera clase se combinarfa con la segunda 
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clase de manera que E. > 5. De igual forma, la clase 6 tiene un E. = 2.28 y se combinarfa con la clase 5. Claro que los 
grados de libertad se reducen de manera correspondiente. 

^Que pasaria si se fija la primera clase en “570 y por debajo de 580” y la ultima en “620 y por debajo de 630” para 
mantener todos los intervalos iguales? Muy poco. P(X) no serfa igual a 1, y £(£.) no serfa igual a £(0.). Sin 
embargo, seria totalmente posible hacerlo. 

De nuevo, Minitab producira los resultados deseados. La pantalla de Minitab 14.1 contiene los comandos de 
entrada y el resultado. El valor p es 0.00329876 < 0.05, llevando al rechazo de la hipotesis nula. 


Pantalla en Minitab 14.1 

MTB> let kl - sum ( (cl - c2) **2/c2) 
MTB> print kl 


[Calculates the chi-square value] 
(Calcula el valor chi-cuadrado) 


Data Display 


Kl 8 . 63444 [The chi-square value] 

MTB > cdf kl k2 ; 

SUBC> chisquare 1. Calculates the p - value 

MTB > let k3 = 1 - k2 [ ( C “elvalorp) 

MTB > print k3 

Data Display 


K3 0.00329876 [The p-value] 
MTB > (Valor p) 


B. Tablas de contingencia. Una prueba de independencia 

Vale la pena destacar que en todos los problemas vistos hasta ahora, habia un solo un factor que captaba el 
interes. Sin embargo, chi-cuadrado tambien permitira la comparacion de dos atributos para determinar si existe una 
relacion entre ellos. Un minorista desea descubrir si existe una relacion entre los niveles de ingreso de los 
consumidores y su preferencia por su producto. Los gerentes de produccion siempre se interesan por la relacion 
que pueda existir entre la productividad de sus empleados y el tipo o grado de capacitacion que recibieron. 

Wilma Keeto es la directora de investigation de productos en Dow Chemical. En su proyecto actual, la 
senorita Keeto debe determinar si existe alguna relacion entre la clasificacion de efectividad que los consumidores 
asignan a un nuevo inseeticida y el sitio (urbano o rural) en el cual se utiliza. De los 100 consumidores a quienes 
se les practico la encuesta, 75 vivian en zonas urbanas y 25 en zonas rurales. La tabla 14.4 resume las clasificaciones 
hechas por cada consumidor en una tabla de contingencia como las que se presentaron en el capftulo 4. 

La tabla tiene /= 3 filas y c = 2 columnas. Existen fc = 6 celdas en la tabla. Por ejemplo, vale la pena observar que 
31 clientes clasificaron el producto “por encima del promedio”, 20 de ellos estaban en zonas urbanas. 
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Tabla 14.4 

Tabla de contingencia 
de Dow Chemical 


Atributo A - Clasificacion 

Atributo B - Ubicacion 

Urbano 

Rural 

Total 

Por encima del promedio 

20 

11 

31 

Promedio 

40 

8 

48 

Por debajo del promedio 

15 

6 

21 

Total 

75 

25 

100 


La senorita Keeto desea comparar el atributo B (ubicacion) con el atributo A (clasificacion del producto). 
Sus hipotesis son 

H q : La clasificacion y la ubicacion son independientes 
H a : La clasificacion y la ubicacion no son independientes. 

Si la ubicacion no tiene ningun impacto en la clasificacion de efectividad, entonces el porcentaje de residentes 
urbanos que calificaron el producto “por encima del promedio” deberfa ser igual al porcentaje de residentes 
rurales que clasificaron el producto “por encima del promedio”. Este porcentaje a su vez deberfa ser igual al de 
todos los usuarios que calificaron el producto “por encima del promedio”. 

Como lo muestra la tabla 14.4, el 31% de todos los 100 usuarios clasificaron el producto “por encima del 
promedio”. Luego el 31% de los 75 residentes urbanos y el 31% de los 25 residentes rurales deberfan dar esta 
clasificacion si la clasificacion y la ubicacion son independientes. Estos valores de (75)(0.3 1 ) = 23.3 y (25)(0.3 1 ) = 
7.75 dan las frecuencias esperadas E. para cada celda, como se observa en la tabla 14.5 


Tabla 14.5 

Frecuencias 
de la 

Atributo A 

Atributo B 

Totales 

Urbano 

Rural 

clasificacion 


0=20 

0.-11 

31 


Por encima del promedio 

£=23.3 

£=7.75 




Q=40 

0.=8 

48 


Promedio 

f=36 

£=12 




0=15 

0=6 

21 


Por debajo del promedio 

£=15.8 

£=5.25 



Total 

75 

25 

100 


Los E. restantes se calculan de forma similar y se presentan en la tabla 14.5. Por ejemplo, 48% de los 100 
usuarios clasificaron el producto como “promedio”. Por tanto, si la hipotesis nula es correcta, el 48% de los 75 
clientes urbanos tambien deberfan clasificar el producto como “promedio”, y el 48% de los 25 consumidores 
rurales deberfan registrar una clasificacion de “promedio”. Los E se calculan como (75)(0.48) = 36 y (25)(0.48) = 1 2 . 
De igual forma, debido a que 21 de los 100 usuarios, o 21% clasificaron el producto “por debajo del promedio”, 
entonces 21% de las 75 personas que viven en centros urbanos (E. = 15.8) y 21% de los 25 que vive en zonas 
rurales (E = 5.25) deberfan proporcionar una clasificacion “por debajo del promedio”. 

Probar las hipotesis requiere una comparacion de O. y E. sobre las fc =6 celdas, utilizando la ecuacion: 


Prueba chi-cuadrado 

2 _ ■y (O, £,) 2 

£ E, 

[14.3] 
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Para el problema actual, Wilma encuentra que: 

, (20 - 23 ,3) 2 (11 - 7.75) 2 (40 - 36) 2 

* 23.3 7.75 36 

(8 - 12) 2 (15 - 15.8) 2 (6 - 5.25) 2 

12 + 15.8 + 5.25 

= 3.76 


La prueba tiene (f- l)(c- 1) = (3- 1)(2- l) = 2gradosdelibertad. Si Wilma fijaa= 10%, x 2 0l02 = 4.605. Como 
lo muestra la figura 14.5, la hipotesis nula no se rechaza de acuerdo con la regia de decision: 


Regia de decision: “No rechazar la hipotesis nula si x 2 < 4.605. Rechazar si x 2 > 4.605”. 


Figura 14.5 

Prueba chi-cuadrado 
de independencia 



La pantalla de Minitab 14.2 se obtiene colocando los datos de los clientes urbanos en la columna 1 y los de los 
residentes rurales en la columna 2 y luego haciendo clic en STAT > TABLES > CHISQUARE TEST. 


Pantalla en Minitab 14.2 

Chi-square test (Prueba chi-cuadrado) 


Expected counts are printed below observer counts (Los conteos esperados se imprimen 
debajo de los conteos del observador) 




Cl 


C2^ 

Total 

1 


20 


11«_ 

31L 


23 

.25 

7. 

75 


2 


40 


8 

48 


36 

.00 

12. 

00 


3 


15 


6 

21 


15 

.75 

5. 

25 


Total 


75 


25 

100 

Chisq 

=r 

0.454 

4 - 1 

.363 

4 



0.444 

4 1 

.333 

4 



0.036 

4 0 

.107 

= 3.738 

df - : 

2 , E 

) = 0. 

155 




The top number in each cell is O v (El numero superior en 

cada celda es 0 } .) 

The bottom number is E.. (El numero inferior es E .) 
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Vale la pena anotar que informan el valor chi-cuadrado de 3.738 y el valor p de 0.155. 
El ejemplo 14.2 proporciona una ilustracion adicional. 


Ejemplo 14.2 

Hedonistic Auto Sales desea determinar si existe alguna relation entre el ingreso de los clientes y 
la importancia que dan al precio de los automoviles de lujo. Los gerentes de la companfa desean 
probar la hipotesis de que 

H q : Ingreso e importancia del precio son independientes. 

// A : Ingreso e importancia del precio no son independientes. 

Solution 

Los clientes estan agrupados en tres niveles de ingreso y se les pide asignar un nivel de significancia 
para poner precio a la decision de compra. Los resultados se muestran en la siguiente tabla de 
contingencia. Debido a que 182/538 = 33.83% de todos los que respondieron a la encuesta agregan 
un nivel de importancia “grande” al precio, entonces si el ingreso y el precio no estan relacionados, 
se esperarfa que 33.83% de ellos, en cada clasificacion de ingresos respondan que el precio era de 
“gran” importancia. Por tanto, los E. para un nivel de importancia “bajo” son (198)(0.3383) = 66.98, 
(191)(0.3383)= 64.62, y (149X0.3383) =50.41. 


Atributo A: Nivel de importancia 

Bajo 

Atributo B: Ingreso 

Medio 

Alto 

Total 

Grande 

o 

ii 

GO 

GO 

0=62 

1 

0=37 

182 


£=66.98 

1 

£=64.62 

1 

£=50.41 

1 


Moderado 

(2=52 

0.=71 

0=49 

1 

172 


£=63.32 

l 

£=61.06 

£=47.64 

1 


Poco 

0=63 

1 

0=58 

1 

0=63 

184 


£=67.72 

1 

£=65.32 

£=50.96 


Totafes 

198 

191 

149 

538 


De forma similar, 172/538 = 31.97% de todos quienes respondieron clasificaron el precio como 
moderadamente importante. Por ende los £. para la categoria de “moderado” son 198(0.3197) = 
63.32, 191(0.3197) = 61,06, y 149 (0.3 197) =47.64. 

Para la categoria de “poco”, los datos muestran que 1 84/538 = 34.20% de todos los clientes daban 
poca importancia al precio. Por consiguiente los E. son (198)(0.342) = 67.72, (191)(0.342) = 65.32, y 
(149)(0.342) = 50.96. 

Chi-cuadrado es 

,2 = (83 - 66.98) 2 + (62 - 64.62) 2 ( (37 - 50.41) 2 (52 - 63.32) 2 

X 66.98 64.62 50.41 + 63.32 + 

(63 - 50.96) 2 
50.96 

= 15.17 

Si sedeterminaaen l%,y con (f- 1 )(c - 1 ) = (3 - 1 )(3 - l) = 4gradosdelibertad.x 2 00U = 13.277. 
Como se observa en la figura, la regia de decision es: 
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Regia de decision: “No rechazar la hipotesis nula si % 2 < 13.277. Rechazar si % 2 > 13.277”. 



Interpretation 

La hipotesis nula se rechaza. Existe solo un 1% de probabilidad de que si no existe relacion entre 
ingreso y significance del precio, las diferencias entre Q. y E. serian lo suficientemente grandes 
como para producir un chi-cuadrado mas grande que 13.277. Existe evidencia de una relacion entre 
el ingreso de los clientes y la importance dada al precio de un auto de lujo. 


El resto de este capitulo esta dedicado a diferentes pruebas no parametricas. Varias de tales pruebas se 
analizan para ilustrar: 1) cuando deberfa utilizarse la prueba, 2) el proposito principal y la aplicacion de la prueba, 
y 3) la interpretation de la prueba. Se explora 

La prueba de signo 

La prueba de rachas 

La prueba U de Mann- Whitney 

La prueba de correlation de rangos de Spearman 

La prueba de Krustal- Wallis 

Se comenzara con la prueba de signo. 


Ejercicios de la seccion 


1. El vicepresidente de operaciones del First National Bank argumenta que los tres tipos de credito - creditos 
para autos, creditos a estudiantes y creditos para propositos generales- se conceden a los clientes en las 
mismas proporciones. Para probar su hipotesis, usted recolecta datos sobre 200 creditos recientes y se 
encuentra que 55 fueron creditos para autos, 47 para estudiantes y el resto para propositos generales. Al 
nivel del 5%, ^que le dirfa usted al vicepresidente? 

2. Dados los resultados del ejercicio anterior, usted acredita que los prestamos otorgados a los clientes se 
ajustan a un patrdn tal que la mitad son para propositos generales y el resto se dividen de manera equitativa 
entre los dos tipos de creditos restantes. Utilizando la muestra del problema anterior, ^que concluye al nivel 
del5%? 

3. A los compradores del centro comercial local se les pide calificar un nuevo producto en una escala continua 
que comienza en cero. Con base en los siguientes datos agrupados, £puede usted concluir al nivel del 5% que 
los datos estan distribuidos normalmente, con una media de 100 y una desviacion estandar de 25? 
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Calificacion 

Frecuencia 

Menos de 50 

1 

50-70 

51 

70-90 

112 

90-110 

151 

110-130 

119 

130-150 

43 

150-170 

21 

Mas de 170 

2 

Los analistas de Federated Stores plantean la hipotesis de que los ingresos de sus clientes estan distribuidos 


normalmente. Con base en los datos suministrados aqui, ^que conclusion saca al nivel del 1%? 

lngreso(US$1 ,000) 

Frecuencia 

Menos que 35 

1 

35-40 

4 

40-45 

26 

45-50 

97 

50-55 

96 

55-60 

65 

60-65 

8 

65-70 

2 

Por encima de 70 

1 

TransWorld Airways desea determinar si existe alguna relacion entre el numero de vuelos que las personas 
toman y su ingreso. j,A que conclusion llega al nivel del 1% con base en los datos para 100 viajeros en la tabla 
de contingencia? 


Ingreso 

Frecuencia de vuelos 

Nunca 

Rara vez 

Con frecuencia 

Menos de US$30,000 

20 

15 

2 

US$30, 000-50,000 

8 

5 

1 

US$50, 000-70, 000 

7 

8 

12 

Mas de US$70,000 

2 

5 

15 


14.3 Prueba del signo 

Una prueba no parametrica utilizada comunmente para tomar decisiones comerciales es la prueba del signo. Esta 
prueba es la mas usada con frecuencia para contrastar la hipotesis comparando dos distribuciones poblacionales, 
y por lo general implica el uso de pares correspondientes. Se supone que se tienen datos antes y despues para 
una muestra y se desean comparar estos conjuntos de datos correspondientes. Se hace restando las observaciones 
por pares en un conjunto de datos de las del segundo, y se nota el signo algebraico que resulta. No se tiene interes 
en la magnitud de la diferencia, sino solo en si resulta un signo mas o un signo menos. 
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La prueba del signo es la contraparte no parametrica de la prueba t para pares correspondientes. La prueba t 
requiere la suposicion de que las poblaciones estan normalmente distribuidas. En muchos casos, esta suposicion 
no es posible. La prueba del signo es util en estos casos. 

La hipotesis nula establece que no existe diferencia en los conjuntos de datos. Si esto es cierto, entonces un 
signo mas y un signo menos son igualmente probables. La probabilidad de que ocurra cualquiera es de 0.50. Una 
prueba de dos colas es: 


Ho- m = p 

H A :m±p 

en donde my p son los numeros de signos menos y de signos mas, respectivamente. Una prueba de una sola cola 
es: 

H 0 :m<p 
H A :m> p 

o 

H 0 :m>p 

H A :m<p 


Prueba del signo Prueba disenada para probar la hipotesis que compara las 
distribueiones de dos poblaciones. 


Debido a que existen dos posibles resultados, un signo menos y un signo mas, y a la probabilidad de que cada 
uno siga constante ensayo tras ensayo, se puede utilizar la distribucion binomial. 

Se supone que usted esta trabajando como analista de mercado y desea medir la efectividad de un juego 
promocional del producto de su empresa. Antes del juego promocional, usted selecciona 12 tiendas minoristas y 
registra las ventas del mes, redondeando o aproximando al US$100 mas proximo. Durante el segundo mes, el juego 
promocional se complementa y se registran de nuevo las ventas. La tabla 14.6 muestra estos niveles de ventas, 
junto con el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del primer mes. Un 
signo mas registrado en la ultima columna significa que las ventas bajaron durante el segundo mes. 


Tabla 14.6 

Tienda 

Antes del juego 

Durante el juego 

Signo 

Ventas para doce 

1 

US$42 

US$40 

+ 

tiendas minoristas 

2 

57 

60 

- 


3 

38 

38 

0 


4 

49 

47 

+ 


5 

63 

65 

- 


6 

36 

39 

- 


7 

48 

49 

- 


8 

58 

50 

+ 


9 

47 

47 

0 


10 

51 

52 

- 


11 

83 

72 

+ 


12 

27 

33 

_ 
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Se asume ademas que usted desea probar la hipotesis de que la promocion incremento las ventas al nivel del 
5%. Si las ventas subieron en el segundo mes cuando la promocion estaba vigente, entonces al restar dichas 
ventas del primer mes producina signos menos. Luego se esperarfa que el numero de signos menos, m , excediera 
el numero de signos mas, p. Es decir ,m>p . Esta afirmacion no contiene un signo igual y por tanto es la hipotesis 
altemativa, produciendo una prueba con cola a la derecha: 

H 0 : m < p 
H A :m> p 

Ahora se debe preguntar, Que hana que se rechazara la hipotesis nula?” Debido a que la hipotesis nula 
establece que m < p, entonces o 1) un numero significativamente grande de signos menos o 2) un numero 
significativamente pequeno de signos mas resultarfa en el rechazo de la hipotesis nula. Es decir, la hipotesis nula 
se rechaza si m es demasiado grande o si p es demasiado pequeno. 

La tabla 14.6 muestra 6 signos menos y 4 signos mas para un total de n = 10 signos. Los valores que resultan 
en una diferencia de cero se ignoran. Las observaciones 3 y 9 por consiguiente se eliminan y no se consideran. 
Luego, se determina la probabilidad de seis o mas signos menos o de cuatro o menos signos mas si las 
probabilidades de ambos son n = 0.50. Si esta probabilidad es menor que el valor a seleccionado, los resultados 
de la muestra son significativos y se rechaza la hipotesis nula. Sin embargo, si la probabilidad de los resultados 
muestrales es mayor que a, los resultados pueden atribuirse a un error de muestreo; no se rechaza la hipotesis 
nula. Es decir, que si los resultados muestrales observados realmente tienen probabilidad de ocurrir, no se 
interpretan como un hallazgo significativo y no se puede rechazar la hipotesis nula. 

De la tabla C del apendice III, la probabilidad de seis o mas signos menos es 

P(m>6\n = 10, 7T = 0.5) = 1 - P(X < 5) 

= 1 - 0.6230 
= 0.3770 

Claro que si se obtienen seis o mas signos menos, se debe haber obtenido cuatro o menos signos mas. Por 
consiguiente la probabilidad de cuatro o menos signos mas es tambien 0.3770: 

P(p^4\n= 10,tt = 0.5) = 0.3770 

Este valor de 0.3770 es la probabilidad de obtener seis o mas signos menos (o cuatro o menos signos mas) si 
H, la probabilidad de ocurrencia de cualquier signo en cualquier ensayo es de 0.50. Se nota que si el numero de 
signos menos fuera inusualmente grande, se refutana la hipotesis nula. Sin embargo, 6 no es un numero grande. 
La probabilidad de obtener seis o mas signos es muy alta: 37.7%. Debido a que la probabilidad de su ocurrencia 
es mayor que un a de 5%, el evento de seis signos menos no se considera grande, y la hipotesis nula de que 
"o :m >p no se rechaza. 

Si la promocion fuera efectiva, habrfa un numero grande de signos menos, y la hipotesis nula de que m<ps,e 
rechazana. Pero como se ha visto, seis signos menos no es un numero inusualmente grande, y no se puede 
considerar que la promocion fue exitosa. 

Si una prueba se basara en la prueba con cola a la izquierda, la hipotesis seria 

H 0 :m^ p 
H A :m<p 

Si m es inusualmente pequena, o p es inusualmente grande, se rechazana la hipotesis nula. Se supone que un 
experimento con n = 12 ensayos da cinco signos menos y siete signos mas. Se tendrfa entonces que hallar la 
probabilidad de obtener cinco o menos signos menos, o la probabilidad de obtener siete o mas signos mas. Si la 
probabilidad es menos que el a seleccionado, se rechaza la hipotesis nula. 

El ejemplo 14.3 ilustra una prueba de dos colas. El unico ajuste es que a debe dividirse por dos. Las hipotesis 
son s 
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Ho - m — p 
H A :m* p 

Las hipotesis se prueban comparando a/2 a cualquiera de entre 1) la probabilidad de que el signo que ocurrio con 
menos frecuencia pueda ocurrir muchas veces o menos, o 2) la probabilidad de que el signo que ocurrio mas 
frecuentemente pueda ocurrir muchas veces o mas. 


Ejemplo 14.3 

Honda probo la resistencia al uso de dos tipos de bandas de rodamiento de los neumaticos en su 
motocicleta Nighthawk (halcon nocturno). Se seleccionaron diez motos aleatoriamente. Los 
mecanicos montaron los neumaticos con un tipo de banda en el frente, y la otra banda de rodamiento 
atras. Despues de manejar las motocicletas un numero de millas especificado bajo las condiciones 
estableeidas, produjeron un desgaste entre 0 y 40 cada neumatico. Una calificacion mas alta indico 
un mejor neumatico. Los resultados se muestran en la siguiente tabla. Los analistas de Honda 
desean probar la hipotesis de que no hay diferencia en las clasificaciones de desgaste al nivel del 
10%. Las hipotesis son 

Ho - m = p 

H A :mi=p 


Gasification de desgaste 

Neumaticos 

Tipo de banda 1 

Tipo de banda 2 

Signo 

1 

32 

37 

- 

2 

27 

25 

+ 

3 

21 

21 

0 

4 

13 

17 

- 

5 

25 

29 

- 

6 

38 

39 

- 

7 

17 

23 

- 

8 

29 

33 

- 

9 

32 

34 

- 

10 

34 

37 

_ 


Solution 

La observation 3 se ignora porque la diferencia es cero. Existe un signo mas y ocho signos menos. 
Honda puede calcular la probabilidad de que uno o menos signos mas puedan ocurrir o la 
probabilidad de que ocho o mas signos menos puedan ocurrir. Concentrandose en el numero de 
signos mas, se tiene de la tabla C (apendice III), que 

P(p < 1 1 n = 9, 7T = 0.5) = 0.0195 

Claro, que se obtiene la misma respuesta si se utiliza el numero de signos menos en la prueba: 

P(m > S\n = 9,tt = 0.5) = 1 - P(m < 7) = 1 . - 0.9805 = 0.0195 
Debido a que a/2 = 0. 10/2 = 0.05 > 0.0195, se rechaza la hipotesis nula. 

Interpretation 

Si la hipotesis nula es cierta, y m = /?, existe solo 1.95% de probabilidad de obtener uno o menos 
signos mas ( u ocho o mas signos menos). Existe menos de a/2 = 0.05% de probabilidad de que la 
(hipotesis nula sea cierta. Se puede concluir que existe una diferencia en las clasificaciones de 
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desgaste. El tipo de rodamiento II es superior debido a que tuvo un numero significativo de signos 
menos. 


Si n > 30, es permisible utilizar la aproximacion normal al binomio. Se asume que en el ejemplo anterior, Honda 
tuvo que tomar como muestra 40 motocicletas y obtuvo 8 signos mas, 28 signos menos, y 4 diferencias cero. La 
compama tendria n = 36 observaciones utiles. 

Como se aprendio en el capitulo 8, si la prueba es de dos colas con a = 0. 10, el valor critico de Z es 1 .65. 

Regia de decision: “No rechazar si - 1 .65 < Z < 1 .65. Rechazar si Z < -1 .65 o Z > 1 .65”. 

El valor de Z es 


Valor de Z para prueba del _ k ± 0.5 - 05n 

signo con muestras grandes 0.5Vn 


[14.4] 


en donde k es el numero apropiado de signos mas o menos y n es el tamano de la muestra. Si k < nil , se utiliza 
k + 0.5. Si k > n/2, se utiliza k- 0.5; es necesario ajustar k en 0.5 porque la distribucion binomial representa datos 
discretos, mientras que la distribucion normal se aplica a datos continuos. 

Debido a que el ejemplo de Honda es una prueba de dos colas, se puede probar o el numero de signos mas o 
el numero de signos menos. Al probar el numero de signos mas se tiene que: 

_ 8 + 0.5 - (0.5X36) 

Z ~ 0.5V36 

= -3.17 

Al probar el numero de signos menos se tiene que 

28 - 0.5 - (0.5X36) 

0.5V36 

= 3.17 

Debido a que — 3. 17< — 1.65, o 3.17 > 1.65, se rechaza la hipotesis nula. Existe una diferencia en los dos tipos de 
neumaticos. El tipo II de rodamiento es superior. 


Ejercicios de la seecion 


6. Dos propagandas de publicidad para computadores las califican 15 clientes potenciales para determinar si 
existe alguna preferencia. Los resultados se presentan aqui. Al nivel del 10%, ^cuales son los resultados? 


Cliente 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

Publicidad 1 

8 

9 

5 

7 

9 

4 

3 

8 

9 

5 

7 

8 

8 

7 

9 

Publicidad 2 

7 

3 

2 

8 

5 

5 

7 

2 

1 

3 

7 

2 

2 

3 

8 


7. El fabricante de 10 tipos de alimentos en paquete plantea la hipotesis de que las ventas de cada producto con 
un alto contenido de grasa seran menores que las del mismo producto con reduccion de grasa. Las ventas en 
miles de unidades aparecen en la siguiente tabla. Al nivel del 10%, ^cual es su conclusion? 
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Alimento 1 2 3 4 5 6 7 8 910 

Con grasa 10 12 14 18 17 18 5 21 6 8 

Sin grasa 15 13 12 9 17 19 3 27 12 14 

8. El brillo de la cristaleria se mide en una escala de 1 a 100. Se prueban 20 vasos antes y despues de ser tratados 
con un nuevo proceso. Si se resta el factor de brillo despues del tratamiento, del de antes del tratamiento y da 
5 signos positivos y 3 signos negativos, ^existe alguna diferencia al nivel del 5%? ^Como interpreta los 
resultados de la prueba? 

9. Cincuenta empleados que han recibido capacitacion especial forman parejas con otros 50 que son parecidos 
en cada aspecto pero que no recibieron capacitacion. La productividad de quienes recibieron capacitacion se 
resta de la de quienes no la recibieron, dando 15 signos positivos y 17 signos negativos. Al nivel del 5%, £el 
entrenamiento hace la diferencia? 


14.4 La prueba de rachas 

La importancia de la aleatoriedad en el proceso de muestreo se ha enfatizado en repetidas ocasiones. Ante la 
ausencia de aleatoriedad, muchas de las herramientas estadisticas en las cuales se confia son de poco uso o de 
ningun uso. Por consiguiente es necesario comprobar la aleatoriedad de las muestras. Se puede lograrlo utilizando 

una prueba de rachas. 

Prueba de rachas Prueba no parametrica de aleatoriedad en el proceso de muestreo. 

Para realizar una prueba de rachas, se asigna a todas las observaciones en la muestra uno o dos simbolos. Una 
racha consiste en una secuencia de uno o mas simbolos similares. Si se agrupan las observaciones en categorfas 
de, por ejemplo A y B, se debe hallar las siguientes secuencias: 


AA 

BBB 

A 

BB 

AAA 

B 

1 

2 

3 

4 

5 

6 


Existen seis rachas, cada una de las cuales consta de una o mas observaciones 



Se supone que se seleccionan los empleados para un programa de entrenamiento. Si la seleccion no depende 
de si el empleado es de sexo masculino (m) o femenino (/), se esperana que el genero fuera un evento aleatorio. Sin 
embargo, si se detecta algun patron en el genero, se puede asumir que la aleatoriedad esta ausente y que la 
seleccion se hizo, por lo menos en parte, con base en el genero de un trabajador. Si existe un numero inusualmente 
grande o inusualmente pequeno de rachas, se sugiere un patron. 

Se asume que el genero de cada empleado se registra para hacer la seleccion y se prueba que es: 

mmm ffffff mmm 


1 


2 


3 
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Tres rachas ocurren en esta muestra. Existen tres hombres, seguidos de seis mujeres, y luego tres hombres. 
Parecerfa que las selecciones no estan lo suficientemente combinadas, produciendo un patron sistematico que 
implica una ausencia de aleatoriedad. Se asume entonces que el orden de la seleccion es: 


m 

f 

m 

f 

m 

f 

m 

f 

m 

f 

m 

f 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 


De nuevo, parece existir un patron que produce un numero inusualmente grande de 12 rachas independientes. 


Deteccion de un patron Si se presentan muy pocas o demasiadas rachas, puede 
estar ausente la aleatoriedad. 


Un conjunto de hipotesis para probar es: 

H q : Existe aleatoriedad en la muestra. 

//* No existe aleatoriedad en la muestra. 

A 

Para probar la hipotesis, se debe determinar si el numero de rachas © es demasiado grande o demasiado pequeno. 
Las tablas Ml y M2 (apendice III), muestran valores crfticos para el numero de rachas si a es 5%. Debido a que en 
la superficie de los ejemplos parecen no aleatorios, se toma un conjunto de selecciones menos evidente. Se 
supone que las selecciones fueron 


m 

fff 

mmm 

ff 

mmm 

1 

2 

3 

4 

5 


Las selecciones parecen mas aleatorias que los otros dos ejemplos porque no existe patron evidente. Se nota que 
n { = 7 es el numero de hombres y n 2 = 5 es el numero de mujeres. 

La tabla M 1 muestra el numero crftico minimo de rachas para un valor a de 5%. Si el numero de rachas es igual 
o menor que el valor mostrado en la tabla Ml, se sugiere que al nivel del 5% hay muy pocas rachas como para 
confirmar la hipotesis nula de aleatoriedad. Debido a que n { = 7 y n 2 = 5, se halla el valor crfticamente bajo que es 
3. Debido a que el numero de rachas excede este minimo, entonces no hay un numero significativamente bajo de 
rachas como para garantizar el rechazo de la hipotesis nula. La tabla M2 proporciona valores crfticamente altos 
para r Si el numero de rachas en una muestra es igual a o mayor que estos valores, se puede concluir que existe 
un numero extremadamente grande de rachas, lo que sugiere la ausencia de aleatoriedad. Para n x = 7 y n 2 = 5, la 
tabla M2 revela que el numero maximo de rachas es 1 1. Si el numero de rachas es superior all, existen demasiadas 
como para sustentar la hipotesis de aleatoriedad. Debido a que el numero de rachas es menor que 11, no es 
significativamente alto y no se rechaza la hipotesis nula al nivel del 5%. Parece que la seleccion muestral es el 
resultado de la aleatoriedad. 

Cuando los datos muestrales no caen naturalmente en una de las dos categorfas posibles, se puede utilizar la 
mediana como medida para bifurcar los datos. Se asumen niveles de production diarios en una mina de carbon 
seleccionada para un estudio estadfstico, y estos son, 3 1 , 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32, 40, 37, 60 toneladas. 
La mediana de 37 puede utilizarse como valor de referencia. Las observaciones caen o por encima (A) o por debajo 
(B) de 37, produciendo ocho rachas de: 


31 57 52 22 24 59 25 29 27 44 43 32 40 60 

B AA BB A BBB AA B AA 

1 2 3 4 5 6 7 8 
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Con n { = 7 para B y «, = 7 para A, la tabla M revela valores crfticos de 3 y 13 rachas. Debido a que habfa ocho 
rachas, se asume que hay aleatoriedad y no se rechaza la hipotesis nula. 

Otra aplicacion de la prueba de rachas se encuentra en una prueba de aleatoriedad en el metodo de mfnimos 
cuadrados ordinarios (MCO) del analisis de regresion. Una propiedad basica del modelo de regresion MCO es 
que los errores son aleatorios. No deberia existir un patron en los signos de estos errores. El ejemplo 14.4 ilustra 
como puede utilizarse la prueba de rachas para probar esta condicion. 


Ejemplo 14.4 

Una empresa investigadora de mercadeo desarrollo un modelo para prededr las ventas mensuales 
de un nuevo producto. Despues de 17 meses, se calcularon los errores y se probo que se teman los 
siguientes signos: 


++++++ 


++++ 

— 

1 

2 

3 

4 


A1 nivel del 5%, ^parece haber aleatoriedad en los terminos de error? 

Solucion 

Existen n= 10 signos mas, n 2 =7 signos menos, y r = 4 rachas. Las tablas Ml y M2 revelan los 
numeros minimo y maximo crfticos de rachas, respectivamente como 5 y 14. Las hipotesis son 

H 0 \ La aleatoriedad prevalece 
H a : La aleatoriedad no prevalece. 

Regia de decision: “No rechazar la hipotesis nula si 5 < r < 14. Rechazar si r < 5 o r > 14”. 

Debido a que r = 4, la hipotesis nula deberia rechazarse al nivel del 5%. 

Interpretation 

El numero de rachas es significativamente pequeno. Existen muy pocas rachas como para sustentar 
la hipotesis de aleatoriedad. La validez del modelo de regresion es cuestionable, y la empresa 
deberia analizar las altemativas. El bajo numero de rachas resulta del hecho de que los errores de un 
signo son seguidos por los errores de signos similares, lo que es un indicio de autocorrelacion 
positiva. 


Si tanto n l como n 2 son may ores que 20, la distribucion de muestreo para r se aproxima a la normalidad. La 
distribucion tiene una media de 


Media de la distribucion muestral u = 2/il - + l 

•T | , 

del numero de rachas 1 2 


[14.5] 


y una desviaci6n estandar de: 


Desviacion estandar 
de la prueba de rachas 


j 2n i n 2 (2n i n 1 ~ n x - n 2 ) 

<J ' V(n, + n 2 ) 2 ( n i + n 2 ~ 1) 


[14.6] 
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Estandarizar la distribution de rachas puede lograrse utilizando la desviacion normal: 


Desviacion normal para _ r - /x r 

la distribution de rachas - a,. 


[14.7] 


Una presentation de ventas realizada ante un grupo de 52 compradores potenciales culmino en 27 ventas, 25 
no- ventas y 18 rachas. A1 nivel de significancia del 1%, ^la muestra es aleatoria? 

H q : La muestra es aleatoria 
H . : La muestra no es aleatoria 

A 

A1 nivel del 1 %, el valor crftico de Z para la prueba de dos colas es 2.58. Como se observa en la figura 14.6, 

Regia de decision: “No rechazar la hipotesis nula si -2.58 < Z < 2.58. Rechazar la hipotesis 
nula si Z < -2.58 o Z > 2.58”. 


Figura 14.6 

Prueba de aleatoriedad 
en las ventas 



Entonces, mediante la formula [14.5], 


M, = 


2 n ,« 2 

n, + n 2 


+ 1 


_ 2(27)(25) 
" 27 + 25 
= 26.96 


y mediante la fdrmula [14.6] 

! 2n l n2(2nj/i 2 - n ] - n 2 ) 

a ' "V(n, + « 2 ) 2 (,, + n 2 - 1 ) 

i [2(27)(25)][2(27)(25) - 27 - 25] 
V (27 + 25) 2 (27 + 25 - 1) 


La desviacion normal es 


= 3.56 


07 

18 -26.96 
3.56 


= -2.52 
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Existe evidencia insuficiente para rechazar la hipotesis nula. Pareciera que la muestra es aleatoria. Existe un 99% 
de probabilidad de que un proceso de muestreo aleatorio con 27 y 25 observaciones en 2 categorfas, y con 18 
rachas, dieran un Z entre ±2.58. 

El ejemplo 14.4 puede utilizarse para ilustrar como Minitab puede realizar una prueba de rachas. En la columna 
1 de la ventana de datos, ingrese seis numeros 1 para los seis signos mas, cinco numeros 2 para los cinco signos 
menos, cuatro numeros 1 para los siguientes cuatro signos mas, y luego dos numeros 2 para los ultimos dos 
signos menos. Haga clic en STAT > NONPARAMETRICS> RUNS TEST. Seleccione Above y Below e ingrese 1.5. 
Haga clic en OK. La impresion se presenta como la pantalla de Minitab 14.3. El valor p dice que se rechaza la 
hipotesis nula en cualquier valor a por encima de 0.0068. 


Pantalla en Minitab 14.3 

Runs test (Prueba de rachas) 

Cl 

K - 1.5000 

The observed no. of runs = 4 {No. de rachas observado) 

The expected no. of runs = 9.2353 (No. de rachas esperado) 

7 Observations above K 10 below {7 observaciones por encima K 10 por debajo) 

* N Small -- Following approx, may be invalid (N pequeno -- Despues de aproximacion 
puede no ser valido) 

The test is significant at 0.0068 (La prueba es signif icativa a 0.0068) 


14.5 Prueba U de Mann-Whitney 

La prueba U de Mann-Whitney ( o simplemente la prueba U) contrasta la igualdad de dos distribuciones 
poblacionales. Se basa en la suposicion de que dos muestras aleatorias se sacan independientemente de variables 
continuas. En su sentido mas amplio, la hipotesis nula establece que las distribuciones de dos poblaciones son 
identicas. Sin embargo, la prueba puede realizarse para analizar la igualdad de las dos medias o medianas 
poblacionales. Para contrastar la igualdad de las medias, se debe asumir que las poblaciones son simetricas y que 
tienen la misma varianza. Bajo tales condiciones la prueba U de Mann-Whitney sirve como altemativa no 
parametrica de la prueba t, salvo que no requiere el supuesto de normalidad. Si el supuesto de simetrfa se elimina, 
la mediana reemplaza la media como estadistico de prueba. 


Prueba U de Mann-Whitney Es la eontraparte no parametrica de la prueba t para 
muestras independientes. No requiere del supuesto de que las diferencias entre las dos 
muestras esten distribuidas normalmente. > 


Los datos estan ordenados o clasificados del mas bajo al mas alto. No existe esfuerzo alguno en hacer pares, 
al igual que como se ha hecho cuando se han tornado dos muestras. (Observe que la prueba U de Mann-Whitney 
es la misma que la prueba de las sumas de rangos de Wilcoxon, pero difiere de la prueba de rangos de signos de 
Wilcoxon. La similitud en los nombres puede ser confusa.) 

Para ilustrar la prueba U , se supone que una fabrica de ceramicas desea comparar el tiempo que toma a las 
piezas de barro enfriarse despues de haber “ardido” en el homo mediante dos metodos diferentes. 
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Los alfareros queman las 12 piezas utilizando el metodo 1, y 10 utilizando el metodo 2. El numero de minutos 
necesarios para que cada pieza se enfrie es el siguiente: 

Metodo 1 27* 31 28 29 39 40 35 33 32 36 37 43 

Metodo 2 34 24* 38 28 30 34 37 42 41 44 


Las observaciones se ordenan y se clasifican luego de mas bajo a mas alto como se muestra en la tabla 14.7. El 
valor 24 en el metodo 2 es el mas bajo de las 22 observaciones y se le da el rango de 1, y 27 en el metodo 1 tiene 
un rango de 2. Los empates como 28, se promedian sobre los rangos correspondientes. El valor 28 es la tercera 
observation mas baja, y ambos valores de 28 reciben una clasificacion de 3.5. No existe rango de 4, debido a que 
dos observaciones tienen el rango de 3.5. La clasificacion entonces se suma, produciendo 'ZR l y £/? r 


Tabla 14.7 

Rango de tiempos 
de enfriamiento 


Metodo 1 

Rango 

Metodo 2 

Rango 



24 

1 

27 

2 



28 

3.5 

28 

3.5 

29 

5 





30 

6 

31 

7 



32 

8 



33 

9 





34 

10.5 



34 

10.5 

35 

12 



36 

13 



37 

14.5 

37 

14.5 



38 

16 

39 

17 



40 

18 





41 

19 



42 

20 

43 

21 





44 

22 


= 130 


= 123 


Se calcula el estadistico U de Mann- Whitney para cada muestra de la ecuacion, asi: 


Estadistico (Vde Mann-Whitney 
para la primera muestra 


U \ = n x n 2 H — ~ 


nAn, 4- 1) 


- XR t 


[14.8] 


y 
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Estadistico U de Mann-Whitney 

n 0 (n? +1) ^ 

U 2 = n,n 2 + 1 - 2R, 

[14.9] 

para la segunda muestra 




Los datos de la tabla 14.7 dan: 


£/, = (12)(10) + 12 ^ + ^ - 130 

= 68 


U 2 = (12)( 10) + ~ - 123 

= 52 


Se nota que U 1 + U 2 ~ n J n 2 proporciona un chequeo rapido de su aritmetica. 

Si n x y n 2 son ambas por lo menos 10, la media y la desviacion estandar de la distribucion muestral para el 
estadistico U son: 


Media de la distribucion 



muestral para la prueba U 

n } n 2 

A = “7T~ 

[14.10] 

de Mann-Whitney 




y 


Desviacion estandar 
de la distribucion 
muestral para la prueba U 
de Mann-Whitney 

n ] n 2 (n l + n 2 + 1) 

°* “ V 12 

[14.11] 

En el caso actual se tiene que: 

(12)(10) 

R-u = 2 


y 

= 60 


<*, = 

/(12)(10)( 12 +10+1) 


V 12 



= 15.17 
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La distribution del estadfstico U puede normalizarse mediante la formula: 


Valor Z para normalizar la z _ U± ~ m„ 

prueba U de Mann-Whitney 


[14.12] 


donde U. es el valor de U apropiado, entre U { o U 2 dependiendo de la naturaleza de la prueba. Permite determinar 
cual valor U es apropiado. 


A. Prueba de dos colas 

En el ejemplo de los homos, la fabrica de ceramica puede querer probar la hipotesis de que los tiempos promedio 
de enfriamiento del metodo 1 y del metodo 2 son los mismos. Esto requiere una prueba de dos colas con las 
hipotesis: 

« 0 : Mi ~ M2 
H a : fx x # fx 2 

En una prueba de dos colas, bien sea U { o U 2 pueden utilizarse en la formula [14.12]. Por tanto, utilizando 
arbitrariamente U r se tiene que 


Z = 


52 -60 
15.17 
-0.53 


Si a = 10%, la regia de decision como se refleja en la figura 14.7, es 


Reglade decision: “Norechazar si-1.65 <Z< 1.65. Rechazar siZ<-1.65 oZ> 1.65”. 


Figura 14.7 

Prueba de dos colas 
de los tiempos 
promedio 
de enfriamiento 



Por tanto Z = -0.53 y esta en la zona de no rechazo, la fabrica de ceramica puede concluir al nivel de significance 
del 10% que los tiempos promedio de enfriamiento son los mismos para ambos metodos de coccion. 


B. Prueba de una cola 

Se supone que la fabrica considero que el metodo 1 resultarfa en un tiempo promedio de enfriamiento de >ji 0 . 
Entonces las hipotesis 

/z, £ m 2 

h a- Mi > M 2 
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requieren una prueba de una cola. Si se va a realizar una prueba con cola a la derecha, entonces el valor U de la 
formula [14. 12] debe ser el mayor de los dos valores de U. Debido a que U l = 68 > U 2 = 52, U { se utiliza para calcular 
el valor Z. Si esta fuera una prueba con cola a la izquierda, el valor menor de U se utilizarfa para calcular Z. 

Dada la prueba con cola a la derecha se tiene que: 

68 - 60 
15.17 
= 0.53 

Si a = 0. 10 se mantiene para esta prueba de una sola cola, la regia de decision, como se presenta en la figura 14.8 
es 


Regia de decision: “No rechazar si Z < 1 .28. Rechazar si Z > 1 .28”. 


Figura 14.8 

Prueba de una cola 
para los tiempos 
promedio 
de enfriamiento 



El valor Z de 0.53 claramente esta en la zona de no rechazo. La fabrica no rechaza la hipotesis nula de que 
| 1 1 < |x, y no puede concluir que el metodo 2 conlleva a tiempos de enfriamiento mas rapidos. 

La pantalla en Minitab 14.4 muestra los resultados de la prueba para la fabrica de ceramica mencionada 
anteriormente. Se proporcionan estimados puntuales y por intervalo para la diferencia en las medianas poblacionales. 
El valor de W = 1 30.0 es la suma de los rangos de la variable almacenada en la primera columna y puede utilizarse 
para calcular U { y U r El valor p de 0.4057 es mayor que el valor a seleccionado del 10% y por tanto, expresa que 
no se puede rechazar la hipotesis nula. 


Pantalla en Minitab 14.4 


Mann-Whitney confidence interval and test (Intervalo de confianza y prueba de Mann- 
Whitney ) 


Cl 

N= 12 

Median= 

C2 

N= 11 

Median= 


Point estimate for ETA1-ETA2 is 
90.9 Percent C.I. for ETA1-ETA2 is 


Median = Mediana 

Point estimate = Estimado puntual 
ETAl = U 


34.00 

37.00 

-2 . 00 ETA2 = U 2 

(-7.00,3.00) ( I . C . del 99 por ciento para ETAl - ETA2 ) . 


W = 130.0 

Test of ETAl = ETA2 vs. ETAl = ETA2 is significant at 0.4060 

The test is significant at 0.4057 (adjusted for ties) (La prueba es significante a 
0.4057 [teniendo en cuenta los empates] ) 


Ejercicios de la seccion 


10. A1 propietario de una popular tabema local para estudiantes de una universidad cercana, se le escucho por 
casualidad deeir que los clientes mujeres tendfan a gastar menos que los hombres. Retado por el profesor de 
estadistica quien ocupaba su espacio habitual al extremo del bar, el tabemero registro los gastos de 10 
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mujeres y 10 hombres. Los resultados en dolares aparecen en la siguiente tabla. ^Esta afirmacion se confirma 
al nivel del 10%? 

Mujeres 5/12 115 847 142 102 4A2 172 112 172 4A7 

Hombres 5.83 6.49 4.45 5.12 9.02 9.73 5.42 6.43 8.79 8.89 

11. Rapid Roy probo dos tipos de combustible en su clasico deportivo, y noto la velocidad maxima que permitfa 
cada combustible. Con base en los resultados presentados aquf en millas por hora, ^existe alguna diferencia 
en la velocidad promedio que proporciona cada combustible al nivel del 1%? 

Combustible 1 45 67 54 41 38 59 48 31 59 31 

Combustible 2 79 82 69 84 76 77 81 65 73 70 69 

12. Los costos de vivienda de 42 residentes en Topeka, Kansas, se compararon con los de 35 residentes en Erie, 
Pennsylvania. Se clasificaron las observaciones, produciendo X/' , I = 1,833.5 y XA ( = 1,169.5. Al nivel del 5%, 
^parece haber alguna diferencia en los costos promedios de vivienda en las dos ciudades? 

13. Petroleum Transport envfa petroleo crudo via dos lfneas de embarque, FreightWays y OverSeas. Ultimamente, 

se ha vuelto evidente que algunos de los envfos llegan con menos petroleo del que aparece en la lista del 
manifiesto. Los recortes medidos en miles de barriles se descubrieron en 50 envfos de FreigtWays y 45 envfos 
de OverSeas. Los resultados se calificaron produciendo XA, = 1 ,434.5 y XA = 1 ,258.5. ^Existe evidencia que 
sugiera que FreightWays tiene una reduction mas grande? 


14.6 Correlacion de rangos de Spearman 

El analisis anterior sobre regresion y correlacion proporciono los medios para medir la relacion entre dos variables. 
Se aprendio como calcular e interpretar el coeficiente de correlacion de Pearson y por ende medir la fuerza de la 
relacion entre dos variables. 

Sin embargo, este metodo requiere valores numericos precisos y el supuesto de normalidad en la distribucion 
de tales valores. En muchos casos, tal medida numerica no puede ser posible, y puede no existir confirmacion para 
el supuesto de normalidad. En tales casos, no puede utilizarse el metodo de Pearson. 

No obstante, se puede todavia clasificar sistematicamente u ordenar las observaciones. Esta clasificacion 
ordinal permite medir los grados de correlacion entre dos variables utilizando el coeficiente de correlacion de 
rangos de Spearman. 


Correlacion de rangos de Spearman Medida de la relacion entre dos variables que 
han sido clasificadas originalmente de mas bajo a mas alto {o de mas alto a mas bajo) 


El ano pasado, Amco Tech, un fabricante de microchips para computador en Estados Unidos, contrato a siete 
tecnicos en computacion. A los tecnicos se les practico un examen disenado para medir sus conocimientos 
basicos. Despues de un ano de servicio, a su supervisor se le pidio clasificar el desempeno laboral de cada 
tecnico. Los puntajes del examen y las clasificaciones del desempeno para los siete empleados aparecen en la 
tabla 14.8 

Vale la pena observar que aunque el puntaje del examen es una medida cuantitativa de los conocimientos de 
los tecnicos, la clasificacion del desempeno es simplemente una medida ordenada por el supervisor para saber 
cuales tecnicos se estaban desempenando laboralmente bien. Por tanto, el jefe de operaciones decide utilizar la 
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correlation de rangos de Spearman para determinar si existe alguna relation entre los puntajes del examen y el 
desempeno laboral. El director debe desarrollar primero la clasificacion para los puntajes del examen. Tales 
clasificaciones, junto con algunos calculos necesarios aparecen en la tabla 14.9. 


Tabla 14.8 

Datos sobre teenicos 
de Amco Tech 


Tecnico 

Puntaje en el examen 

Clasificacion del desempeno 

J. Smith 

82 

4 

A. Jones 

73 

7 

D. Boone 

60 

6 

M. Lewis 

80 

3 

G. Clark 

67 

5 

A. Lincoln 

94 

1 

G. Washintong 

89 

2 


Tabla 14.9 

Clasificaciones 
de los teenicos 
de Amco Tech 


Tecnico 

Puntaje 
en el examen 

Clasificacion Clasificacion por 

en la prueba (X) el desempeno (K) 

X- Y=d j 

(X-Y) 2 = d 2 . 

J. Smith 

82 

3 

4 

-1 

1 

A. Jones 

73 

5 

7 

-2 

4 

D. Boone 

60 

7 

6 

1 

1 

M. Lewis 

80 

4 

3 

1 

1 

G. Clark 

67 

6 

5 

1 

1 

A. Lincoln 

94 

1 

1 

0 

0 

G. Washington 

89 

2 

2 

0 

0 

T-I d] 


El director puede calcular entonces el coeficiente de correlation de rangos de Spearman, r , utilizando la 
formula [14.13]: s 


Coeficiente de correlation 
de Spearman 


' s = 1 - 


61d] 

n{n 2 - 1 ) 


[ 14 . 13 ] 


donde d. es la diferencia entre las clasificaciones para cada observacion 
n es el tamano de la muestra 

Entonces 


. _ ( 6 )( 8 ) 

' s 7(7 2 - 1) 

= 0.857 

A1 recordar que un coefipiente de correlacion cae entre — 1 y 1, la muestra sugiere una relacion fuerte, positiva 
entre el puntaje del examen del tecnico y su clasificacion del desempeno laboral. 

Con frecuencia se desea comprobar la hipotesis de que el coeficiente de correlacion poblacional, p , es cero. 
Es decir, se desea determinar la probabilidad de que, a pesar de los hallazgos de la muestra que sugieren una 
relacion entre el puntaje y la clasificacion, en realidad no existe tal relacion y p s = 0. 
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Para las muestras pequenas ( n < 30), la distribucion de r s no es normal, ni la prueba t es apropiada. Mas bien 
debe utilizarse la tabla N del apendice III. Los valores cnticos de la tabla N se comparan con r s para probar las 
hipotesis 

H Q : p s = 0; No existe relacion entre las dos variables 
H a : p s ^ 0; Existe relacion entre las dos variables 


Con la ayuda de la figura 14.9, la tabla N revela que si se prueba la hipotesis a a = 0. 1 0, una muestra de tamaho n 
- 7 tiene valores cnticos de ±0.6786. 


Figura 14.9 

Prueba de hipotesis 
para Amco Tech 



Regia de decision: “No rechazar la hipotesis nula si -0.6786 < r s < 0.6786. Rechazar la hipotesis 
nula si r s < -0.6786 o r s > 0.6786. 

El valor r 5 = 0.857 esta en la zona de rechazo de la derecha. Por tanto, se puede rechazar la hipotesis nula de 
p s = 0 y concluir al nivel de significancia del 10% que existe una relacion entre los puntajes de prueba y las 
clasificaciones del desempeno laboral. 

Si n > 30, la distribucion de r s se aproxima a la normalidad con una media de cero y una desviacion estandar de 
1 Nn - 1 . El estadistico de la prueba Z es: 


Desviacion normal para 

7 - 0 

< 

la prueba de rangos 

l/Vn-1 

M 4-14] * 

de Spearman 

= r s \Zn~—~l 

•* 


El ejemplo 1 4.5 lo muestra. 


Ejemplo 14.5 

Amco Tech esta considerando si comercializar un disco duro para computadores de mesa. Se realiza 
un experimento con 32 discos duros seleccionados aleatoriamente para determinar si hay una 
relacion entre el numero de horas en las que se prueba un disco duro antes de la venta y el numero 
de veces que el disco falla en el proceso de terminar de correr un programa de computation. De 
forma razonable, el gerente de la division de control de calidad espera que la tasa de fallas disminuya 
a medida que aumenta el numero de horas en que se prueba el disco. Las horas de prueba y el 
numero de fallas para los 32 discos, junto con las clasificaciones de cada variable, se presentan en 
la siguiente tabla. Para ambas variables, la observacion mas alta recibio la primera clasificacion, y la 
mas baja recibio la clasificacion numero 32. 
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Disco 

Horas 

Clasificacion por horas (X) 

Fallas 

Clasificacion por fallas (Y) 

X - Y 

(X - Y) 2 

1 

100 

1.0 

2 

32.0 

-31.0 

961.00 

2 

99 

2.5 

3 

30.5 

-28.0 

784.00 

3 

99 

2.5 

3 

30.5 

-28.0 

784.00 

4 

97 

4.0 

4 

28.5 

-24.5 

600.25 

5 

96 

5.5 

4 

28.5 

-23.0 

529.00 

6 

96 

5.5 

5 

27.0 

-21.5 

462.25 

7 

95 

7.0 

8 

21.5 

-14.5 

210.25 

8 

91 

8.0 

6 

25.5 

-17.5 

306.25 

9 

89 

9.0 

7 

23.5 

-14.5 

210.25 

10 

88 

10.5 

10 

17.5 

-7.0 

49.00 

11 

88 

10.5 

8 

21.5 

-11.0 

121.00 

12 

80 

12.0 

9 

19.5 

-7.5 

56.25 

13 

79 

13.0 

9 

19.5 

-6.5 

42.25 

14 

78 

14.5 

10 

17.5 

-3.0 

9.00 

15 

78 

14.5 

11 

15.5 

-1.0 

1.00 

16 

77 

16.0 

7 

23.5 

-7.5 

56.25 

17 

75 

17.5 

12 

13.5 

4.0 

16.00 

18 

75 

17.5 

13 

12.0 

5.5 

30.25 

1 9 

71 

19.0 

11 

15.5 

3.5 

12.25 

20 

70 

20.5 

14 

11.0 

9.5 

90.25 

21 

70 

20.5 

12 

13.5 

7.0 

49.00 

22 

68 

22.5 

6 

25.5 

-3.0 

9.00 

23 

68 

22.5 

16 

7.5 

15.0 

225.00 

24 

65 

24.0 

15 

9.5 

14.5 

210.25 

25 

64 

25.0 

15 

9.5 

15.5 

240.25 

26 

60 

26.5 

16 

7.5 

19.0 

361.00 

27 

60 

26.5 

18 

3.5 

23.0 

529.00 

28 

58 

28.0 

19 

2.0 

26.0 

676.00 

29 

56 

29.0 

17 

5.5 

23.5 

552.25 

30 

55 

30.5 

20 

1.0 

29.5 

870.25 

31 

55 

30.5 

18 

3.5 

27.0 

729.00 

32 

50 

32.0 

17 

5.5 

26.5 

702.25 

10,484.00 


Solucion 


_ 6(10,484) 
32(32 2 - 1) 
= -0.922 


Sea a = 0.01. A continuation sigue una prueba de hipotesis respecto al coeficiente de correlation 
poblacional: 
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H 0 : p, = 0 

H a : Ps *Q 

El valor cntico de Z es ± 2.58. Entonces 

Z = (-0.922)^32=1 
= — 5.14 

Como se observa en la figura, deberfa rechazarse la hipotesis nula 



Interpretacion 

el valor r s de -0.922 indica una relacion fuerte negativa entre horas y fallas. Entre mas se pruebe un 
disco antes de ser utilizado, menos fallas experimental al finalizar el programa completo. 


Para utilizar Minitab, ingrese los datos para cada variable en columnas separadas. Clasifique cada una con 
MANIP > Rank. Luego haga clic en STAT> BASIC STATISTICS > CORRELATION. Minitab reportara r s . 


Ejercicios de la section 


14 . Los economistas del Mid- West Research Institute estan realizando un estudio para analizar la relacion entre 
los ingresos de las personas y sus niveles de consumo. Once consumidores reportaron las siguientes cifras 
en miles de dolares. Al nivel de significancia del 5%, £el coeficiente de correlacion de rangos de Spearman 
sugiere alguna relacion? 

Ingreso 97 58 69 47 58 38 91 67 68 47 48 

Consumo 55 63 54 37 45 38 71 52 53 37 37 


15 . Al nivel del 10%, ^existe una relacion entre el tiempo de estudio en horas y las notas en el examen, de acuerdo 
con estos datos? 


Tiempo 21 18 15 17 18 25 18 4 6 5 

Nota 67 58 59 54 58 80 14 15 19 21 

16 . Las clasificaciones de las tasas de rendimiento de 50 acciones se comparan con las clasificaciones de su 
razon precio-ganancia produciendo £d 2 = 19,412.5. Al nivel del 5%, ^que puede concluir sobre una relacidn 
entre las dos variables de las acciones? 

17 . Ochenta y cinco hombres y 85 mujeres califican un producto produciendo Hd 2 = 10,010.25. Al nivel de 
significancia del 1%, ^existe alguna correlacion entre las clasificaciones con base en el genero? 
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14.7 Prueba de Kruskal-Wallis 

La prueba U de Mann- Whitney sirve como la contraparte no parametrica de la prueba t para dos muestras 
independientes; se utiliza para comparar dos poblaciones. Si se necesita comparar mas de dos poblaciones, la 
prueba Kruskal- Wallis se aplica como extension logica de la prueba de Mann- Whitney, y se utiliza para probar 
la hipotesis respecto a la distribucion de tres o mas poblaciones. En este sentido, la prueba de Kruskal- Wallis 
funciona como la contraparte no parametrica del diseno completamente aleatorizado utilizado en las pruebas 
ANOVA. Mientras que las pruebas ANOVA dependen del supuesto de que todas las poblaciones en comparacion 
estan distribuidas normalmente, la prueba Kruskal- Wallis no coloca esta restriccion en la comparacion. 


Prueba de Kruskal-Wallis Es una prueba que compara tres o mas poblaciones para 
determinarsi existe una diferencia en la distribucion de las poblaciones. Esanaloga de 
la prueba Futilizada en las pruebas ANOVA. 


La hipotesis nula establece que no hay diferencia en la distribucion de k poblaciones bajo comparacion. Las 
hipotesis entonces son: 

H : Todas las k poblaciones tienen la misma distribucion. 

H a : No todas las k poblaciones tienen la misma distribucion. 

La prueba requiere que las observaciones sean clasiflcadas, al igual que en la prueba de Mann- Whitney. 

Para ilustrar. Supongamos que como nuevo gerente de cuentas de Pox Skin Ointment, debe comparar el tiempo 
que les toma a los tres clientes pagar los envfos de No-Flaw-Face Cream, un nuevo producto ofrecido por Pox. Se 
seleccionan aleatoriamente varias compras de cada cliente, junto con el numero de dfas que cada uno se tomo en 
liquidar su cuenta. Los resultados aparecen en la tabla 14.10. El numero de observaciones en todas las muestras 
no tienen que ser iguales. 


Tabla 14.10 

Numero de dias para 
pagar a Pox la entrega 
recibida 


Compra 


Cliente 


1 

2 

3 

1 

28 

26 

37 

2 

19 

20 

28 

3 

13 

11 

26 

4 

28 

14 

35 

5 

29 

22 

31 

6 

22 

21 


7 

21 




Luego, cada observation debe clasificarse de mas bajo a mas alto. Al igual que con la prueba de Mann- 
Whitney, a los empates se les asigna un rango igual a la clasificacion promedio para tales observaciones. Las 
clasificaciones luego se suman para todas las k = 3 muestras. La tabla 14.1 1 contiene los resultados. El estadfstico 
Kruskal-Wallis es el siguiente: 


Prueba de Kruskal-Wallis 


K = 


12 

n(n + 1) 



- 3(n + 1) 


[14.15] 
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en donde 


n. es el numero de observaciones en la i-6 sima muestra 
n es el numero total de observaciones de todas las muestras 
R. es la suma de los rangos de la i-6 sima muestra. 


iao,a Cliente 1 Cliente 2 Cliente 3 

Rangos para Pox Dias Rango Dias Rango Dias Rango 




11 

1 



13 

2 







14 

3 



19 

4 







20 

5 



21 

6.5 

21 

6.5 



22 

8.5 

22 

8.5 





26 

10.5 

26 

10.5 

28 

13 





28 

13 



28 

13 

29 

15 









31 

16 





35 

17 





37 

18 


X/? 1= 62 


SR, =34.5 


ZR= 74.5 


Luego se halla K utilizando la formula [14. 15], asi: 


= 12 r ( 62 ? ( 34 . 5) 2 ( 74 . 5) 2 

18(18 + 1 ) [ 7 6 5 

= 8.18 


- 3(18 + 1 ) 


Ahora solo resta comparar K con un valor crftico. La distribucion de K es aproximada por una distribucion chi- 
cuadrado con k - 1 grados de libertad. Si K excede el valor crftico de chi-cuadrado, se rechaza la hipotesis nula. La 
figura 14. 1 0 lo ilustra. En caso de seleccionar un valor a de 5% en la prueba de Pox, el valor crftico de chi-cuadrado, 
dado es 3 - 1 = 2 grados de libertad se vuelve % 2 0052 = 5.99. 


Regia de decision: “No rechazar si k < 5.99. Rechazar si k > 5.99”. 



5.99 


8.18 
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Debido a que k = 8.18 > 5.99, se rechaza la hipdtesis nula de que no hay diferencia en el tiempo que toma a tres 
clientes cancelar sus cuentas con Pox. 

En el caso de que se rechace la hipdtesis nula, el siguiente paso logico es determinar cuales diferencias son 
estadi'sticamente significativas y cuales se deben a un error de muestreo. Es decir, una vez que se ha determinado 
que no todas las poblaciones tienen la misma distribution, se deben identificar las poblaciones que son 
significativamente diferentes. Este es en gran parte el proceso como en el cual se utilizaron los metodos de Tukey 
para detectar diferencias significativas en el estudio de ANOVA. De la misma manera que con el metodo de Tukey, 
este involucra una comparacion de todos los pares posibles. 

Primero se debe calcular el rango promedio de cada muestra R. dividiendo la suma del rango de la muestra por 
el numero de observaciones en dicha muestra. Para la primera muestra es: 

R x = ~ = 8.86 

- 34.5 - 74.5 

De igual forma, R 2 = - =5.75 y * 3 = - — = 14.9. Las diferencias absolutas se hallan 

|fli - * 2 | = |8.86 - 5.75| = 3.11 

|*! - * 3 | = 1 8.86 - 14.9 1 = 6.04 

I *2 ~ * 3 I = 1 5.75 - 14.9 1 = 9.15 

Estos valores absolutos se comparan luego con un valor crftico para determinar si difieren significativamente. 
Este valor crftico C k se calcula asf: 



en donde % 2 a , k _ , es el valor chi-cuadrado para probar la hipotesis original, 5.99 en este caso. 
n. y n. son los tamanos de dos muestras en comparacion 

Si la diferencia real entre los rangos promedio de dos muestras es mayor que la diferencia crftica, se considera una 
diferencia significativa y se encuentra que las dos poblaciones son diferentes. 

Si se tiene un diseno balanceado con muestras de igual tamaho, C k sera igual para todas las comparaciones 
por pares. Si el diseno, como en este caso no es balanceado, debe calcularse un valor diferente para C k por cada 
comparacion. Para comparar el cliente 1 con el cliente 2 para Pox, C k es 



= 7.27 


Debido a que I*, — * 2 1 — |8.86 — 5—75 I = 3. 1 1 es menor que 7.27, las poblaciones 1 y 2 no difieren. De igual forma, 
C k para las poblaciones 1 y 3 es 7.65. Debido a que la diferencia absoluta observada entre 1 y 3 es 6.04 < 7.65, estas 
dos poblaciones no son diferentes. Finalmente, C k para las poblaciones 2 y 3 es 7.91. La diferencia real entre 2 y 
3 es 9.15 > 7.91, y se dice que las poblaciones 2 y 3 son diferentes. 

Puede utilizarse el subrayado comun para resumir con base en los rangos promedio. 

R 2 R-, /? 3 

5.75 8.86 14.9 
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La pantalla de Minitab 14.5 proporciona los resultados de la prueba para Pox. H = 8.18 es el valor k que se 
calculo anteriormente. Tambien se proporciona el valor p de 0.017 . 


Pantalla en 

Minitab 

14.5 



Kruskal-Wallis Test (Prueba de 

Kruskal-Wallis) 


LEVEL 

NOBS 

MEDIAN 

AVE. RANK 

Z VALUE 

(Nivel ) 


(Mediana) (Rango promedio) 

(Valor Z) 

1 

7 

22.00 

8.9 

-0.41 

2 

6 

20.50 

5.7 

-2.11 

3 

5 

31.00 

14.9 

2.66 

OVERALL 

(Global) 

H = 8.18 

H = 8.24 

18 

d.f. = 

d.f. = 

2 p - 0.017 

2 p - 0.017 

9.5 

(adjusted for ■ 

ties) (teniendo en cuenta los empates) 


Debe ser evidente ahora que es posible utilizar ciertas pruebas no parametricas cuando los supuestos esenciales 
necesarios para tales procedimientos estadisticos estudiados en capitulos anteriores no se pueden mantener. 
Ante la ausencia de condiciones especificas como la poblacion distribuida normalmente, tales pruebas no 
parametricas pueden ser el unico camino de accion apropiado. 

La tabla 14.12 compara las pruebas no parametricas con sus contrapartes parametricas. Cuando es apropiado, 
se suministra el analogo parametrico para cada prueba no parametrica. La tabla tambien indica los supuestos 
requeridos por las pruebas parametricas que no son necesarias para realizar la contraparte no parametrica. 


Tabla 14.12 

Prueba 


Supuesto no 

Contraparte 

Comparaeion 
de las pruebas 

no parametrica 

Proposito 

necesario 

parametrica 

Signo 

Prueba para 

Distribucion normal 

Prueba t para pares 

parametricas 


la ubicacion 

de las poblaciones 


y no parametricas 

Rachas 

de la distribucion 
poblacional 

Prueba para 
aleatoriedad 


Ninguna 


U Mann-Whitney 

Compara 

Diferencia entre 

Prueba t para 



dos muestras 

muestras es normal 

muestras 



independientes 


independientes 


Kruskal-Wallis 

Compara tres 

Medias muestrales 

Prueba FAN0VA 



o mas muestras 

distribuidas 

normalmente 



Rango de Spearman 

Prueba para 

Distribucion 

Coeficiente 



la relacion entre 

de ambas variables 

de correlacion 



dos variables 

clasificadas 

ordinalmente 

es normal 

de Pearson 


Ejercicios de la seccion 


18 . Recientemente, Bytec, Inc., ha tenido un problema con el ausentismo de los empleados en sus tres plantas de 
produccion. Con base en los siguientes datos, tornados durante un perfodo de seis dias, sobre el numero de 
empleados que estaban ausentes, <?,al nivel de significancia del 5% parece que hay una diferencia en el numero 
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de empleados que no llegan a trabajar? Si usted rechaza la hipotesis nula, realice una comparacion por pares 
completa, con un subray ado comun. 


Numero de empleados ausentes 

Planta 1 

25,36,38,31,29,33 

Planta 2 

31,28,39,41,21,20 

Planta 3 

29,28,22,26,24,20 


19 . Para probar un nuevo alimento para mascotas, Puppy Love alimenta a cuatro grupos de cachorros de 1 0 
semanas de edad con diferentes combinaciones de comida. Despues de tres semanas se registra el incremento 
de peso. ^Existe una diferencia significativa en los incrementos de peso al nivel del 5%? Si usted rechaza la 
hipotesis nula, realice una comparacion completa por pares con subrayado comun. 


Incremento en el peso (libras) 


Mezcla 1 

3, 6, 9,5, 6 

Mezcla 2 

3,4,8,97 

Mezcla 3 

10,8,9,8,7 

Mezcla 4 

8,10,11,8,8 


20 . Security Investments utiliza tres metodos para seleccionar las acciones para sus portafolios. Al nivel del 5%, 
^existe una diferencia en las tasas de rendimiento para cada metodo con base en estos datos? Si usted rechaza 
la hipotesis nula, realice una comparacion por pares completa con el subrayado comun. 

Tasas de rendimiento (porcentajes) 

Portafolio 1 14,12,10,15,13 

Portafolio 2 9, 6,8,5, 5 

Portafolio 3 6,8,5.97 


Problemas resueltos 

1. Ser o no ser - Un problema de control de calidad Segun U.S. News & World Report, un laboratorio en Atlanta 
esta procesando el veneno de serpiente para utilizarlo en la investigacion medica. Se estan probando cinco 
metodos para determinar cual metodo tiene menos probabilidad de contaminar el veneno procesado. Si se 
prueba que una solution venenosa esta contaminada, se marca con el sfmbolo “2B”. Cada metodo produce 
25 ampolletas de veneno cada dia. Las ampolletas de cada metodo de procesamiento se empacan en cajas 
para ser enviadas a las instalaciones donde se realiza la investigacion medica. 

Para los propositos del autor se supone que los cientificos del laboratorio consideran que la contaminacion 
esta distribuida normalmente, pero otros argumentan que esta distribuida binomialmente. Se contrata un 
consultor estadistico para analizar los patrones de defectos. 

a. iLa contaminacion es uniformed Se selecciona la production durante un periodo de 100 dias para cada 
metodo de procesamiento, y se anota que metodo produjo las ampolletas menos contaminadas en ese dfa. 
Si las tasas de contaminacion fueran uniformes, los cientificos esperarfan que cada metodo produjera las 
ampolletas menos contaminadas sobre un numero igual de dfas. Por tanto, E. = n/k = 100/5 = 20. Ambas, las 
frecuencias observadas y esperadas, se muestran en la tabla adjunta. Por ejemplo, en 34 de los 100 dlas, el 
metodo 1 produjo las ampolletas menos contaminadas de veneno de serpiente. Las hipotesis son: 

H q : Las tasas de contaminacion son uniformes. 

H a : Las tasas de contaminacion no son uniformes. 
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Metodo de procesamiento 

F 

0. 

(O - E) 2 

l o. - £.) 2 IE 

1 

20 

34 

196 

9.80 

2 

20 

17 

9 

0.45 

3 

20 

14 

36 

1.80 

4 

20 

12 

64 

3.20 

5 

20 

23 

49 

0.45 


100 

100 


15.70 


Con K - 1 = 4 grados de libertad, la tabla H (apendice III ) muestra que una prueba del 1 % revela un valor 
crftico de x 2 - el valor de % 2 001 4 = 13.277. Como lo muestra la figura, la regia de decision es: 


Regia de decision: “No rechazar si % 2 < 13.277. Rechazar si % 2 > 13.277”. 

= 15.7 

Debido a que 15.7 > 13.277, se rechaza la hipotesis nula. La tasas de contaminacion no parecen ser uniformes. 



b. i La contaminacion es binomial? Los cientificos del laboratorio quienes apoyan la idea de un patron de 
contaminacion binomial argumentan que 5% de las ampolletas producidas estan contaminadas. Dada la 
tasa del 5%, el consultor estadistico va a comprobar las siguientes hipotesis: 

H 0 : Las tasas de contaminacion son binomiales 

H ' Las tasas de contaminacion no son binomiales 

A 

La prueba se aplica primero al metodo 1. Cada caja contiene n = 25 ampolletas. Si existe una distribution 
binomial en las tasas de contaminacion con n = 0.05 como argumentan los cientificos, la probabilidad de 
que cualquier caja contenga un numero dado de ampolletas contaminadas, X , se encuentra en la tabla 
binomial. Por ejemplo, si n = 25 y n = 0.05, la probabilidad de que una caja contenga cero ampolletas 
contaminadas puede encontrarse en la tabla C (apendice III) como P(X = 0 \n = 25, n = 0.05) = 0.2744. La 
probabilidad de que solo una de las 25 ampolletas este contaminada puede encontrarse en la tabla C como 
P(X < 1) - P(X < 0) = 0.6424 - 0.2740 = 0.3650, y asi sucesivamente. Por tanto, el numero esperado de cajas 
de las 100 muestras que contienen cero ampolletas contaminadas es nP. = (100)(0.2774) = 27.74 cajas. Para 
efectos de determinar P(x) de la tabla binomial, n = 25 porque hay 25 ampolletas en cada caja. Para 
determinar el numero de cajas con x ampolletas contaminadas, n - 100 debido a que son 100 cajas. 

Los valores de E. y O x aparecen en la siguiente tabla. La primera tabla muestra que 3 1 de las 100 cajas del 
metodo 1 tuvieron cero ampolletas contaminadas: 
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Numero de ampolletas contaminadas 

O. 

P{X) 

E 

/ 

0 

31 

0.2774 

27.74 

1 

32 

0.3650 

36.50 

2 

24 

0.2305 

23.05 

3 

10 

0.0930 

9.30 

4 

2 

0.0269 

2.69 

5 o mas 

1 

100 

0.0072 

0.72 


Sin embargo, algunos de los valores de E. son menores que 5. Las ultimas tres clases deben combinarse para 
corregirlo. La segunda tabla es el resultado: 


Numero de ampolletas contaminadas 

O. 

P{X) 

E. 

{0-EyiE i 

0 

31 

0.2774 

27.74 

0.3831 

1 

32 

0.3650 

36.50 

0.5548 

2 

24 

0.2350 

23.50 

0.0106 

3 o mas 

13 

0.1226 

12.26 

0.0447 


100 



0.9932 


Si a = 0.05, x 2 o . 05 .3 = 7.815 


Regia de decision: “Norechazar si % 2 < 7.815. Rechazar si x 2 >7.815”. 

Debido a que % 2 = 0.9932, no se rechaza la hipotesis nula. Las tasas de contaminacion parecen estar distribuidas 
en forma binomial. 

2. La prueba del signo - Un caso de control de calidad En un esfuerzo por mejorar su producto, una empresa que 
vende productos de pastelena pide a 15 degustadores calificar su pan de harina de trigo entre 0 y 10 antes y 
despues de un leve cambio en los ingredientes. Los resultados se muestran parcialmente en la siguiente tabla: 


Degustador 

Calificacion antes 

Calificacion despues 

Signo 

1 

7 

8 

- 

2 

6 

6 

0 

3 

9 

8 

+ 

4 

5 

7 


v. 15 

8 

7 

+ 


En total se registraron ocho signos mas, cinco signos menos y dos diferencias de cero. La empresa desea 
probar a un nivel del 5% si existe alguna diferencia. Por tanto: 
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Entonces, 

P(m < 5 | n - 13, tt - 0.50) = 0.2905 

La probabilidad de obtener a lo sumo cinco signos menos dado que m = /? es mayor que 0.05/2 = 0.025. La 
empresa no rechaza la hipotesis nula. 

Si el tamano de la muestra hubiera sido superior a 30, la formula [14.4] de Z se hubiera utilizado. 

3. Prueba U de Mann- Whitney para las medias Dos despliegues publicitarios se utilizan para ayudar las ventas 
de un producto. La primera termina en ventas diarias de 110, 117, 82, 95, 123,79, 92, 102, 108, y 113. El segundo 
despliegue produjo ventas de 1 1 1, 85, 97, 1 17, 111, 89, 1 18, 121, y 109. ^Parece que al nivel del 5%, = p,? 


Despliegue 1 

Rango 

Despliegue 2 

Rango 

79 

1 

85 

3 

82 

2 

89 

4 

92 

5 

97 

7 

95 

6 

109 

10 

102 

8 

111 

12.5 

108 

9 

111 

12.5 

110 

11 

117 

15.5 

113 

14 

118 

17 

117 

15.5 

121 

18 

123 

19 




90.5=2/?, 


99.5 =2/? 2 


Si se fija a en 5%, el valor critico de Z es ± 1 .96. 



V 

U\ = n x n 2 


H 0 : /x x — ia 2 
H a- Mi * M 2 


+ n ^ n \ + ^ 
2 


- JJR j 


= (10X9) + 


10(10 + 1 ) 


™ 90.5 


2 
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, _ 99 . 5 


= 35.5 




Mi 

2 


= 45 


n l n 2 (n l + n 2 + 1) 
^ A 12 


= 12.247 



54.5 - 45 
12.247 


= 0.7757 

La muestra sugiere que la hipotesis nula no se rechaza, y que ambos despliegues publicitarios tienen el mismo 
efecto en las ventas. 


4. Correlation de rangos de Spearman A una consultora financiera se le pide evaluar las calidades de inversion 
de ocho acciones. Ella utiliza la tasa de dividendo de la accion, tal como se informo en The Wall Street 
Journal \ y un potencial del mdice para el potencial de crecimiento asignado a cada accion por una empresa 
inversionista de Nueva York. Los datos que se presentan aqui se utilizan para determinar si puede existir una 
relacion entre dividendos y potencial de crecimiento: 


Accion 

Tasa 

de dividendo (%) 

Rango 

del dividendo (X) 

Indice 

de crecimiento 

Rango 

del crecimiento (YJ 

X - Y 

i 

3 

1 

4.20 

1 

40 

6 

1 

1 

2 

8.12 

2 

20 

8 

-6 

36 

3 

7.20 

5 

60 

4 

1 

1 

4 

3.20 

8 

35 

7 

1 

1 

5 

8.00 

3 

85 

1 

2 

4 

6 

12.73 

1 

70 

2 

-1 

1 

7 

7.90 

4 

50 

5 


1 

8 

6.20 

6 

65 

3 

3 

9 

54 


6(54) 
8 ( 8 2 - 1 ) 


Si a = 0.10, pruebe 


- 0.357 


Ho' Ps — 0 

H A :p s ±0 


La tabla N (apendice III) re vela un valor crftico de 0.6190. Por consiguiente, no se rechaza la hipotesis nula. 
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Lista de formulas 


[14.1] 


/= i 


E) 2 


[14.2] 


E, = np, 


[14.4] 

k ± 0.5 - 0.5 n 

0.5 Vn 

[14.5] 

■2n { n 2 

M, = ' 2 + 1 

n { + n 2 

[14.6] 

\2n { n 2 {2n { n 2 - /i, - n 2 ) 
(Tr V («, + n 1 j 2 (n l + n 2 - 1) 

[14.7] 

N 

li 

i 


O’, 

[14.8] 

V\ - «|«2 + 1 \ 2 R, 


[14.10] 

= ~y 

[14.11] 

/«i« 2 (/Ji + n 2 + 1) 

V 12 

[14.12] 





6 Zd 2 

[14.13] 

rs ~ 1 n(n 2 - 1) 


[14.14] 


Z = rV« — 1 


[14.15] 


K = 


12 


n(n + 1) 




™ 3 (n + 1) 


/ 2 n{n + 1) 

' 1 

1 Y2 



Se utiliza chi-cuadrado para 
comparar las frecuencias obser- 
vadas con las frecuencias espera- 
das si la hipotesis nula es correcta. 


Las frecuencias esperadas son 
aquellas que se aguardan que 
sucedan si la hipotesis nula es 
correcta. 

Valor Z para una prueba de signos 
de muestras grandes. 

Media de la distribucion muestral 
del numero de rachas. 

Desviacion estandar para la prueba 
de rachas. 

Desviacion normal para la 
distribucion de rachas. 

El estadistico U de Mann- Whitney 
para la prueba de igualdad de dos 
poblaciones. 

Media de la distribucion muestral 
del estadistico U de Mann- 
Whitney. 

Desviacion estandar del estadistico 
U de Mann- Whitney. 

Normalizacion del estadistico U de 
Mann-Whitney. 

Pruebas del coeficiente de corre- 
lacion de rangos de Spearman para 
toda relacion entre variables 
clasificadas por rangos. 

Desviacion normal de la prueba de 
rangos de Spearman con muestras 
grandes. 

La prueba de Kruskal-Wallis se 
utiliza para comparar tres o mas 
poblaciones. 

Determina el valor crftico en una 
prueba de Kruskal-Wallis para las 
comparaciones por pares. 


[14.16] 
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Ejercicios del capi'tulo 

21 . Su supervisor le ha pedido determinar si existe una relacion entre el tipo de tecnica de presupuesto de capital 
que utiliza una empresa y su ingreso neto despues de impuestos. Los datos que usted recolecta relacionan 
tres tecnicas: el valor actual, la tasa interna de retomo, y el fndice de rentabilidad, con cuatro niveles de 
ingreso: US$0 a US$3’000,000, US$3’000,000 a US$6’000,000, US$6’000,000 a US$9’ 000,000, y por encima de 
US$9’000,000. Se ha tabulado el numero de empresas que caen en las categories conjuntas. ^Que herramienta 
estadistica utilizaria para detectar alguna relacion? 

22 . Usted debe comparar los niveles de gastos promedio de tres grupos de consumidores, pero no puede asumir 
que las poblaciones estan distribuidas normalmente o que sus varianzas son iguales. ^Que herramienta 
estadistica deberfa utilizar? 

23 . Como gerente regional de una empresa minorista, usted desea determinar si los niveles de ingreso de las 
personas y sus patrones de consumo estan relacionados. ^Que herramienta estadistica deberfa utilizar? 

24 . Un economista de una companfa intemacional de valores recolecto datos sobre los niveles de consumo de 25 
personas, antes y despues de que el gobiemo federal anunciara un gran incremento en los impuestos. ^Que 
herramienta estadistica permitira al economista determinar si el impuesto afecto el consumo promedio? 

25 . Usted debe seleccionar una muestra de los clientes de su empresa con base en el genero. ^Como puede 
determinar si un procedimiento muestral es aleatorio? 

26 . Su asistente estadfstico ha obtenido datos sobre dos muestras independientes tomadas para comparar las 
edades de las personas. Si no puede asumirse que las poblaciones son normales, ^cual prueba deberfa 
utilizarse? 

27 . ^Por que se utilizan las pruebas no parametricas? <?,Por que no se conffa siempre en las pruebas parametricas 
ya que estas son mas fuertes? 

28 . iQuc se mide con una prueba de signo? 

29. ^Que mide una prueba de rachas? 

30 . Cite su propio ejemplo en el cual se necesite la prueba de Spearman y describa exactamente que es lo que 
usted esta midiendo en su ejemplo. 

31 . Un banco en Des Moines desea determinar si la distribucion de los clientes es uniforme a lo largo de la 
semana. Una encuesta descubre que el numero de clientes de lunes a viemes son 150, 179, 209, 79 y 252. Al 
nivel del 5%, ^parece que existe una distribucion uniforme? 

a. Plantee la hipotesis 

b. Plantee la regia de decision. 

c. Realice la prueba y tome sus determinaciones. 

32 . El profesor Showers argumenta que la distribucion de notas por parte de sus alumnos es de 5% en calificacion 
A, 20% en B, 30% en C, 40% en D y el resto en F. Si este es el caso, su deeano le ha prometido un aumento del 
1 5% en su salario. Al nivel del 1 %, ^el profesor obtiene su aumento si las 100 notas seleccionadas aleatoriamente 
son: 7 de A, 20 de B, 27 de C, 36 de D y 10 de F? 

33 . Creative Floorings ha decidido ordenar sus suministros en volumen si el tamano de tapetes que se colocan en 
las casas esta distribuido normalmente. Ayude a los gerentes de la companfa a tomar su decision con base en 
los siguientes datos muestrales. Sea a 1%. 
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Yardas cuadradas (100's) 

Numero de casas de este tamano 

Hasta 5 

97 

5 a 10 

137 

10 a 1 5 

245 

15 a 20 

256 

20 a 25 

154 

25 y mas 

111 


la tabla de frecuencia que aparece a continuation registra ventas diarias para 200 dias. ^En a = 0.05, las ventas 
parecen estar distribuidas normalmente? 

Ventas 

Frecuencia 

40 hasta 60 

7 

60 hasta 80 

22 

80 hasta 100 

46 

100 hasta 120 

42 

120 hasta 140 

42 

140 hasta 160 

18 

160 hasta 180 

11 

180 hasta 200 

12 

“Ciudadanos para un medio no violento” proporciono datos que luego se publicaron en una emision reciente 
de U.S. News & World Report sobre el numero de actos de violencia que se ve en ciertos tipos de programas 
de television. La organization reclamaba que tales actos ocurrfan con igual frecuencia en todos los tipos de 
programas. Pruebe este reclamo al nivel del 10%. 


Tipo de programa 

Actos de violencia 

Drama 

42 

Peliculas viejas 

57 

Dibujos animados 

83 

Policfas/Detectives 

92 

Comedias 

38 

Noticias 

81 


36. Greenpeace (Paz verde), el grupo de conservation mundial, exigio una sancion de las Naciones Unidas por la 
matanza de bebes foca en lo que se denomino los “meses de alta mortalidad”. Finlandia, que todavia permite 
tales “masacres”, afirmo que la actividad era consistente durante todo el ano y no variaba de mes a mes. 
Dados los datos de 1997, suministrados por Greenpeace, £a que conclusion llega usted? Sea a 1% 


Mes Numero de muertes 


Enero 112 

Febrero 89 

Marzo 156 

Abril 104 

Mayo 165 
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37. El gerente de produccion de AAA, Inc., debe garantizar que su mezcla de productos se ajuste a un sistema 
particular de cuotas. Se le indica que debe ajustarse a un patron que produce 30% de productos de seda, 20% 
de lana, 10% de algodon, y 40% de cuero. De las ultimas 200 unidades producidas, 65 eran de seda, 45 de lana, 
25 de algodon, y 65 de cuero. A1 nivel del 5%, ^deberfa ajustarse al patron de produccion actual? Plantee la 
hipotesis. 

38. Una cadena minorista tiene seis puntos de venta. Ha venido esforzandose mucho para alcanzar niveles de 
ventas similares en todas las seis tiendas. La empresa de publicidad que maneja la gestion promocional afirma 
que en este momento, cada tienda deberfa reportar ventas iguales. Si las ventas no son iguales, la cadena 
minorista ha decidido acabar su asociacion con la agencia publicitaria. ^Que decision se deberfa tomar con 
base en los datos que aparecen a continuation? Plantee su hipotesis. Sea a =0.01. 


Tienda 

Ventas (US$100 1 ) 

1 

42 

2 

37 

3 

53 

4 

51 

5 

45 

6 

47 


39. La tienda por departamentos Macy ’s, de Nueva York, recientemente hizo un estudio para determinar si habfa 
alguna relation entre el estado civil del cliente y su volumen de compras en dolares. Los resultados aparecen 
en la siguiente tabla. ^Cual es su conclusion al nivel de significancia del 5%? 




Volumen en dolares 


<10 

10-19 

20-29 

30-39 

40-49 

Casado 

32 

23 

15 

12 

14 

Divorciado 

51 

17 

10 

15 

13 

Soltero 

21 

19 

29 

35 

39 

Viudo 

18 

15 

19 

10 

9 


40 . El Ministerio de Hacienda de Estados Unidos ha estimado que el “incremento en los honorarios tlpicos del 
contribuyente necesarios para balancear el presupuesto esta distribuido uniformemente en todos los estados”. 
La emision del 28 de febrero de 1994 de U.S. & World Report publico las siguientes estadfsticas: 


Estado 

Incremento del contribuyente 
promedio (10 primeros estados) 

Connecticut 

US$1,100 

New Jersey 

952 

New York 

877 

Massachusetts 

852 

DC 

851 

Maryland 

840 

Nevada 

828 

Illinois 

822 

Washington 

809 

California 

789 


Al nivel del 5%, £el Ministerio de Hacienda puede ser apoyado? 
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41 . The General Store determinara las fechas de ventas con base en la distribution de los rendimientos. Dados 
los siguientes datos, al nivel del 5% ^parece que los rendimientos son normales? Se sabe que la media es 25.6 
yaeslO.l. 


Ingreso/Mes (US$1 00's) 

Numero de meses 

Hasta 10 

10 

10 a 20 

23 

20 a 30 

30 

30 a 40 

25 

40 y mas 

12 


42 . Se consideran los siguientes datos sobre los tiempos de finalization de trabajos, los cuales se tomaron de una 
poblacion con una media de 18 y una desviacion estandar de 4. 


Tiempos (horas) 

Numero de trabajos 

Hasta 10 

10 

10 a 15 

101 

15 a 20 

223 

20 a 25 

146 

25 y mas 

20 


a . Al nivel del 5%, ^puede concluirse que los tiempos estan distribuidos normalmente? 

b. ^En que difieren los resultados si el primer intervalo es “5 a 10”? y el ultimo es “25 a 30”? 

43 . El economista jefe de la Oficina de Ingreso Estatal debate con su supervisor quien argumenta que los pagos 
de impuestos estan distribuidos normalmente. Los datos de 2,000 contribuyentes proporcionan los siguientes 
resultados. Al nivel del 1%, ^el supervisor esta en lo cierto? 


Pago de impuestos (US$10's) 

Contribuyentes 

Hasta 15 

248 

15 a 30 

232 

30 a 45 

489 

45 a 60 

512 

60 a 75 

263 

75 y mas 

256 


44 . Runner's World informo que una encuesta realizada por Converse, sobre personas que para hacer ejercicio 
hacian trote de forma regular, produjo los siguientes resultados. La intention del estudio era determinar si las 
dislancias eran independientes de la preferencia de los deportistas en cuanto a un producto similar al gel 
utilizado en los talones de sus zapatillas para trotar. Al nivel del 1%, ^parece existir alguna relation? Plantee 
la hipotesis. 


Distancia/semana (millas) 

Prefieren gel 

No prefieren gel 

No opinan 

<3 

14 

5 

27 

3-6 

18 

5 

17 

7-10 

12 

8 

8 

10-13 

17 

12 

5 

>13 

19 

8 

2 
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45 . Los datos sobre aiios de experiencia y calificaciones de la eficiencia, para 431 empleados en XYZ, Inc., 
aparecen en la siguiente tabla. ^Se puede concluir que estos atributos son independientes el uno del otro? 
Sea a = 5 %. 


Eficiencia 


Experiencia en anos 

Pobre 

Bueno 

Excelente 

Superior 

<5 

14 

18 

12 

17 

5-10 

18 

13 

27 

42 

11-16 

16 

32 

24 

37 

17-22 

24 

28 

21 

32 

>22 

17 

15 

14 

10 


46 . Los resultados de un estudio realizado por la Asociacion Norteamericana de Mercadeo para determinar la 
relation entre la importancia que dan a la publicidad los propietarios de tiendas y el tamano de la tienda que 
poseen, aparecen en la siguiente tabla. ^Parece que todos los propietarios de tiendas ponen el mismo enfasis 
a la publicidad? Sea a = 0. 10. Plantee la hipotesis 


Tamano 


Publicidad 


Important^ 

No importante 

No opinan 

Pequena 

20 

52 

32 

Mediana 

53 

47 

28 

Grande 

67 

32 

25 


47 . Una compama embotelladora en Atlanta esta interesada en los efectos de tres metodos que utilizan para la 
higiene de los contenedores de vidrio. Califica los contenedores para determinar si la higiene es independiente 
del metodo. A1 nivel de significancia del 10%, ^cual es su conclusion con base en los datos en la tabla? 


Metodo 


Nota de higiene 


Aceptable 

Marginal 

No aceptable 

A 

140 

132 

63 

B 

89 

74 

44 

C 

104 

98 

50 


A ocho sujetos de prueba se les pide calificar un producto antes y despues de ver un comercial sobre el 
mismo. Las calificaciones se presentan en la siguiente tabla, en donde una calificacion de 10 es la mejor. Sea 
a = 0. 10 y utilice una prueba de signo para la hipotesis de que el comercial mejoro la calificacion del producto. 
Plantee la hipotesis. 



Calificaciones 

Sujeto de prueba 

Antes del comercial Despues del comercial 

— 1 

8 

9 

2 

7 

6 

3 

5 

6 

4 

5 

5 

5 

5 

4 

6 

7 

8 

7 

6 

7 

8 

6 

8 
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49. Un compuesto quimico se agrega a una solution a base de aceite, esperando incrementar sus calidades de 
lubrication. Veinte soluciones, 10 con el compuesto y 10 sin este, se comparan respecto a su capacidad para 
lubricar la maquinaria. Cada uno es calificado en una escala de 0 a 10, siendo 10 la mejor. Con base en los datos 
de la tabla, ^parece que el compuesto incrementa la lubrication? Sea a = 0. 10. Plantee la hipdtesis. ^Cual es su 


conclusion respecto al valor del compuesto quimico? 


Grado de lubrication 

Solution 

Sin compuesto 

Con compuesto 

1 

8 

4 

2 

7 

8 

3 

5 

2 

4 

6 

9 

5 

9 

5 

6 

4 

4 

7 

9 

2 

8 

8 

6 

9 

7 

6 

10 

6 

7 

Shytel, Inc., ofrece servicios de comunicacion en todo el mundo con dos satelites, el Falcon y el Eagle. El 
director ejecutivo de Shytel considera que Eagle presenta demoras mayores en la transmision. Los tiempos 
de transmision aparecen en minutos en la siguiente tabla. Al nivel del 5%, ^parece que el director ejecutivo 
esta en lo cierto? Plantee su hipotesis. 


Tiempos de transmision (minutos) 

Falcon 

Eagle 

Signo 

5.2 

4.7 

+ 

8.6 

7.9 

+ 

9.0 

9.7 

- 

4.3 

8.4 

- 

6.2 

3.7 

+ 

7.9 

7.3 

+ 


51. Clyde Bloomquist ha propuesto un cambio en la polftica corporativa respecto a la recoleccion de cuentas por 
cobrar. Considera que reducira el tiempo necesario para obtener el pago de deudas pendientes de los acreedores . 
Los registros de la companfa demuestran que ocho de los acreedores tomaron el numero de dfas que aparecen 
en la tabla, antes y despues del cambio de polftica para remitir los fondos vencidos. ^,Esta Clyde en lo cierto? 
^Deberiamantenerse el cambio de polftica? Sea a = 0. 10. Plantee la hipotesis 


Acreedor 

Antes 

Despues 

1 

18 

12 

2 

27 

22 

3 

32 

31 

4 

23 

24 

5 

31 

28 

6 

36 

24 

7 

18 

16 

8 

35 

25 
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52, A los compradores de un gran centro comercial en Dayton, se les pregunto cual de las dos marcas de yogur 
preferfan. Cuarenta y dos respondieron que el Swedish Heaven, 31 escogieron Merry Melody, y 12 no 
expresaron ninguna preferencia. Si la tienda local de yogur ofreciera una sola marca, ^cual seria la mejor? Sea 
a = 0. 10 Plantee la hipotesis. 

53. Un fabricante utiliza piezas o del proveedor A o del proveedor B para hacer sus productos. Un chequeo de la 
produccion de ayer revela que el orden en el que se utilizaron las partes de estos proveedores era: 


AA BBB AAA B A BB AA BB 

^Parece que las partes se estan utilizando aleatoriamente? Sea ot = 0.05. Plantee su hipotesis y su conclusion. 

54 . Smile Bright vende crema de dientes en tubos de 17 onzas. La gerencia espera que los excedentes y faltantes 
en el contenido sea aleatorio. Si no lo son, la gerencia asume que algo esta mal con el sistema de llenado y 
cerrara la lmeade produccion. ^Deberfa cerrarse la lrnea si los recipientes miden 16.8, 18.2, 17.3, 17.5, 16.3, 17.4, 
16.1, 16.9, 17, 18.1, 17.3, 16.2, 17.3, y 16.8 onzas? Sea a = 0.05. 

55 . Se registraron los ingresos de ventas de los ultimos 37 dias. Usted vera que tales valores estan por debajo de 
la mediana con una “B” y los que estan por encima con una “A”. A1 contar los resultados, usted encuentra 
1 8 de “A”, 19 de “B” con 10 rachas. Su politica es incrementar la publicidad si los ingresos no estan distribuidos 
aleatoriamente. ^Deberia incrementar la publicidad? Plantee la hipotesis. Sea a = 0.05. 

56 . Acme Plumbing licita en trabajos de construccion para edificaciones en la ciudad. Si los contratos los otorga 
la ciudad sin consideration politica, Acme no deberfa presentar ningun patron bien sea que se acepte o se 
rechace su propuesta. Para las ultimas 63 licitaciones. Acme ha tenido 32 aceptadas y el resto rechazadas, con 
27 rachas. A1 nivel del 5%, ^ parece que las propuestas se asignan con base en la politica? Plantee la hipotesis, 
la regia de decision y su conclusion. 

57 . Gladys Glucose ofrece a los visitantes del parque helado con sabor a vainilla y chocolate. Las ultimas 73 
ventas fueron 40 helados de vainilla y 33 de chocolate, con 16 rachas. Si las ventas no son aleatorias, Gladys 
pasara su camion de helados al zoologico local. ^En donde deberfa poner su negocio? Sea a = 0.05. 

58 . Una gran compama contrato 52 hombres y 41 mujeres, resultando 32 rachas. Si la ausencia de aleatoriedad en 
el proceso de contratacion indica discrimination, ^ puede alegarse que la compama discrimina por sexo en sus 
practicas de contratacion? Sea a = 0. 10. 

59 . Durante un perfodo de 12 dias, Gladys Glucosa vendio 4, 1 1, 5, 7, 10, 13, 12, 5, 9, 6, 2 y 1 galones de vainilla y 
19, 4, 6, 8, 18, 17, 17, 15, 3, 16, 14 y 0 galones de chocolate. Utilizando la prueba U de Mann- Whitney, ^ella 
puede concluir que vende en promedio la misma cantidad de ambos sabores? Sea a = 0.01 . 

60 . El director de mercadeo de Software, Inc., trato 15 discos de computador con una solucion especial para 
reducir el desgaste. Se utilizo una segunda solucion para tratar otros 15 discos, y todos fueron evaluados con 
base en el desgaste. Los que fueron tratados con la primera solucion mostraron un desgaste mejorado, 
medido en horns de uso de 65, 73, 82, 52, 47, 51, 85, 92, 69, 77, 84, 68, 75, 74 y 89 horas. Los sometidos a la 
segunda solucion reportaron tiempos de desgaste aumentados de 73, 84, 91, 87, 90, 7 1, 72, 93, 99, 98, 89, 88, 79, 
88 y 98horas. Al nivel del 10%, ^el director puede concluir que existe alguna diferencia en los factores de 
desgaste mejorados? 

61 . El gerente de control de calidad de una gran planta en Denver, da dos manuales de operaciones a dos grupos 
de empleados. Luego, a cada grupo se le prueba sobre los procedimientos de operaciones. Los puntajes 
aparecen en la siguiente tabla. El gerente siempre ha considerado que el manual 1 proporciona una mejor base 
de conocimientos para los nuevos empleados. Compare los puntajes promedio de la prueba de los empleados 
que aqui se presentan y reporte su conclusion. Plantee las hipotesis. Sea a = 0.05. 
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Puntajes de ta prueba de los empleados 

Manual 1 87 97 82 97 92 90 81 89 90 88 87 89 93 

Manual 2 92 79 80 73 84 93 86 88 91 82 81 84 72 74 

62. Para hacer vigas I para la construction de grandes edificios se utilizan dos procesos de fabrication. Se prueba 
cada viga I y se registra su resistencia a la tension. Veintitres vigas elaboradas con el primer proceso dan Ztfj 
= 690, y 27 vigas fabricadas con el segundo proceso produce Xfr, = 585. Un ingeniero constructor argumenta 
que el primer proceso produce vigas que por lo menos tienen la resistencia a la tension observada en las vigas 
hechas con el segundo proceso. A1 nivel del 5%, ^esta en lo cierto? 

63. Un economista agricola trata 50 acres de tierra con el quimico Docide, para incrementar el rendimiento del 
cultivo. Otros 50 acres se tratan con Mildolmine, y se miden los rendimientos. = 2,125 y = 2,925. El 
economista le dice a los agricultores que el Docide, que es el quimico mas economico, producira un rendimiento 
mayor que el Mildolmine. A1 nivel del 10%, £el economista esta en lo cierto? Plantee las hipotesis. 

64. Personnel Management publico un articulo que describe los esfuerzos realizados por una empresa 
manufacturera en Toledo para evaluar a sus supervisores. A los empleados se les pidio calificar a sus 
supervisores en una escala de 10 a 100. A continuation se presenta un subconjunto de los resultados 
obtenidos para tres de las areas de trabajo. Determine si existe una diferencia en las clasificaciones recibidas 
por los supervisores. Plantee las hipotesis, la regia de decision y su conclusion. Sea a 5%. 


Taller 

Oficina 

Puerto de earga 

40 

63 

50 

52 

59 

52 

63 

55 

63 

81 

61 

55 

72 

48 

71 

72 

53 

45 


49 



65. El contratista local en plomeria tomo como muestra un total de 48 llamadas para determinar cual de los cuatro 
tipos de accesorios de plomeria producen mas problemas. A continuation se presentan los resultados: 


Modelo de accesorio 

Numero de fallas 

1 

15 

2 

11 

3 

10 

4 

12 


A1 nivel de significance del 1%, ^la falla de los accesorios parecen estar distribuidos normalmente? Plantee 
sus hipotesis, la regia de decision y la conclusion. 

66. Se analizan cuatro metodos para tratar las varillas de acero y determinar si hay alguna diferencia en la presion 
que las varillas pueden soportar antes de romperse. Los resultados de las pruebas que miden la presion en 
libras antes que se doblen las varillas se muestran en la siguiente tabla. Practique la prueba, complete con las 
hipotesis, la regia de decision y la conclusion. Sea a 1%. 
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Metodo 1 

Metodo 2 

Metodo 3 

Metodo 4 

50 

10 

72 

54 

62 

12 

63 

59 

73 

10 

73 

64 

48 

14 

82 

82 

63 

10 

79 

79 


67 . La compama productora del Segundo Mejor Yogur del Mundo pregunta a 60 personas cual de los cuatro 
sabores nuevos prefieren. Veintiuno escogen el de coco, 13 escogieron ciruelas pasas con cubierta de salsa 
de tomate, 10 seleccionaron mostaza con mantequilla de mam y 16 manifestaron su inclination por la esencia 
de atun. ^Parece haber alguna preferencia entre los sabores por parte de los clientes? Sea a el 10%. Plantee las 
hipotesis y su conclusion. 

68. Para obtener un credito extra en su curso de estadistica, Barbara debe determinar si hay alguna diferencia en 
el numero promedio de horas que los alumnos de primer ano pasan estudiando, los estudiantes de segundo 
ano, los estudiantes de penultimo ano y los de ultimo ano de su universidad. Su investigacion revelo lo 
siguiente: 


Primer ano 

Segundo ano 

Penultimo aho 

Ultimo ano 

20 

18 

22 

29 

29 

9 

19 

31 

10 

12 

21 

27 

17 

15 

31 

22 

15 

14 

42 

18 

23 

22 

22 

31 

27 





Ayude a Barbara a ganar un credito extra en estadistica planteando sus hipotesis y la conclusion. Sea a 10%. 

69 . Como gerente de production de Sports Wear, Inc., Beverlee Hills debe garantizar que las tallas de su nueva 
linea de ropa deportiva se produzcan de acuerdo con un patron predeterminado. La investigacion de mercado 
indica que los clientes prefieren 20% extra grande, 30% grande, 25% mediana, y 25% pequena. Una muestra 
aleatoria de 145 prendas revela 32 extra grandes, 40 grandes, 41 medianas, y 32 pequenas. A1 nivel del 5%, 
^parece que se estan manteniendo las proporciones deseadas de tamanos? 

70 . La senorita Hills del ejercicio anterior, debe determinar si los habitos de gastos de varios grupos demograficos 
son los mismos. Ella analiza el tamano de las compras tipicas, medidas en dolares, de cuatro grupos: hombres 
casados (HC), mujeres casadas (MC), hombres solteros (HS) y mujeres solteras (MS). Encuentra la siguiente 
information: 


HC 

MC 

HS 

MS 

US$50 

US$20 

US$19 

US$87 

17 

23 

32 

20 

23 

82 

66 

95 

48 

46 

72 

34 

63 

13 

41 

11 


A1 nivel de significancia del 1 %, ^parece que existe una diferencia en los habitos de gastos de estos cuatro grupos? 
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71. Dos analistas financieros clasifican segun su valor de inversion siete emisiones de bonos corporativos. Los 
resultados aparecen en la siguiente tabla. Utilizando las clasificaciones como muestra, calcule la prueba de 
correlacion por rangos de Spearman para determinar si existe alguna correlacion entre las practicas de estos 
dos analistas al nivel del 10%. 


Corporation 

Rangos del primer analista 

Rangos del segundo analista 

1 

4 

3 

2 

3 

4 

3 

1 

2 

4 

2 

5 

5 

7 

6 

6 

6 

1 

7 

5 

7 


72. Dos compamas que compran flotas de camiones para uso industrial, califican seis modelos de camion en una 
escala de 1 a 1 0. Calcule el coeficiente de rangos de Spearman para determinar al nivel del 1 % si las calificaciones 
son independientes: 


Modelo 

Calificacion por parte 
de la primera compama 

Calificacion por parte 
de la segunda compama 

1 

8 

9 

2 

7 

6 

3 

5 

8 

4 

7 

5 

5 

3 

7 

6 

2 

8 


73. Todos los 50 estados estan clasificados por dos agencias de viajes segun su preferencia como destino 
vacacional. Los resultados revelan Xd 2 = 22,712. Pruebe la independencia en las clasificaciones al nivel del 
10%. 

74. Las mejores 10 firmas de la lista de los 500 mejores de la revista Fortune fueron calificadas por la AFL-CIO y 
por un grupo gerencial con base en la calidad del sistema de cuidado de la salud que cada compama proporciona 
a sus empleados. Utilizando los resultados que se proporcionan a continuation, determine al nivel del 5% si 
existe alguna correlacion en las practicas de calificacion de los gremios y de la gerencia. 


Empresa 

Calificacion 

gremial 

Calificacion segun 
la gerencia 

Empresa 

Calificacion 

gremial 

Calificacion segun 
la gerencia 

1 

5 

6 

6 

6 

4 

2 

8 

10 

7 

1 

8 

3 

2 

3 

8 

9 

1 

4 

7 

9 

9 

3 

2 

5 

4 

7 

10 

10 

5 


75. Setenta y tres empleados son calificados por dos gerentes con base en sus niveles de productividad. Calcule 
el coeficiente de rangos de Spearman para determinar si las calificaciones son independientes al nivel del 1% 
con 1^ = 78,815. 
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PUESTA EN ESCENA 


Para ayudar a Mama a resolver su problema con Dante, 
como se describio en la seccion Escenario, primero se debe 
determinar las preferencias de los estudiantes en cuanto a 
los sabores de las pizzas. A1 preguntar a 135 estudiantes, 
se encuentra que 47 prefieren peperoni, 63 salchicha y 21 
queso, mientras que 4 prefieren la pizza vegetariana. Mama 
considera que tales preferencias estan distribuidas 
normalmente, mientras que usted considera que es mas 
probable que se ajusten a un patron descrito como 35%, 
45%, 15%y5%, respectivamente. 

Se trata de ajustar una distribution normal a los gastos 
de los estudiantes con base en la encuesta, la cual produjo 
los patrones descritos en la siguiente tabla de frecuencias. 
^Que descubre? 


Gasto 

Frecuencla 

US$0 y menos de US$5 

4 

US$5 y menos de US$10 

11 

US$10 y menos de US$15 

45 

US$15 y menos de US$20 

47 

US$20 y menos de US$25 

25 

US$25 y mas 

3 


Tambien puede determinarse si existe alguna relacion 
entre las preferencias de los estudiantes por las pizzas 
grande (G), mediana (M) o pequena (P) y su condicidn 


como estudiantes graduados (GR) o sin graduar (SG). Los 
datos presentan el siguiente resultado: 



G 

M 

P 

SG 

51 

19 

9 

GR 

22 

15 

19 


Mama esta interesada en saber si existe una diferencia 
en el numero promedio de veces por semana que los no 
graduados comen fuera, en comparacion con los estudiantes 
graduados. Tomando un subconjunto de 10 graduados y 
10 no graduados de la muestra de 135 estudiantes, se 
encuentra que tales numeros son: 


Estudiante 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

No graduado 

6 

9 

11 

8 

6 

12 

15 

5 

7 

9 

Graduado 

3 

0 

8 

4 

2 

2 

5 

4 

1 

0 


<i,Que le dira usted a Mama? 

Finalmente, usted debe determinar si existe alguna 
relacion entre los no graduados con el numero de veces por 
semana que un estudiante come en Mama’s, y su ingreso. 
Los diez estudiantes no graduados reportan ingresos por 
semana de US$50, US$60, US$80, US$55, US$45, US$90, 
US$100, US$50, US$55 y US$60, respectivamente. 

Prepare su informe a Mama en forma de reporte 
estadistico, tal como se describe en el ap^ndice I. 


Del escenario a la vida real 

Como analista de mercado de la seccion Escenario, a comienzos de capitulo, probablemente usted deseara reunir 
la information sobre el menu de las compamas en franquicia como Pizza Hut y Domino’s. Sus ofertas en su area o 
en sectores universitarios similares en otras partes del condado puede proporcionar nuevas ideas para que usted 
las pruebe y ganar colaboracion para los resultados de su encuesta. 

Usted puede revisar los menus de Pizza Hut en ( http://www.pizzahut.com.hk ). En la pagina de presentation 
haga clic en la casilla de pizza animada. Luego haga clic en “Full Menu”. Alii usted se puede poner en contacto 
con diferentes areas para observar la variedad de pizzas que ofrecen, asi como los menus para pasta, para entradas 
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y para bebidas. Explore estas areas. ^Desea ver alguna combination de pizzas especiales de interes potencial en 
su mercado local? i Ya las ha incluido en la encuesta que esta realizando para la pizzeria Mama’s? Algunas de las 
entradas son atractivas y razonables en su mercado local como para ofrecerlas dentro del funcionamiento de 
Mama’s? ^Como puede ayudar al negocio un menu extenso? 

Usted puede analizar lo que ofrece Domino’s en (http//www. dominos. com). En la pagina de presentation haga 
clic en “Explore” (Explorar). En la pagina siguiente haga clic en “Pizza Fest”. Desplacese hacia abajo al enlace “Top 
10!” y haga clic en el. Despues de ver esta information, desplacese hacia la parte inferior de la pagina y haga clic 
en “Pizza Oven”. La columna izquierda proporciona mas informacion sobre un menu mas extenso que en Top 10! 
Responda las mismas preguntas que se plantearon para Pizza Hut. 

^Cuales de estos sitios son mas util para usted y por que? 





Plan del capi'tulo 

A medida que la competencia por los ddlares de consumo se intensifica en todo el mundo, la importancia que una 
empresa da al mejoramiento de la calidad de sus productos crece proporcionalmente. Este capitulo explica las 
pruebas que una empresa puede realizar para mejorar el programa de control de calidad con miras a promover la 
confiabilidad y expandir su participacidn competitiva de mercado. 
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E S C E N A R I 0 


El aho pasado Minot Industries, un fabricante importante 
de cristaleria, se vio forzado a modemizar su planta en 
Toledo para mantenerse al dfa con el nivel de tecnologfa que 
muchos de sus competidores habfan adoptado ante- 
riormente. Desde que la planta fue redisenada, Minot ha 
experimentado numerosos problemas con sobrecostos, 
produccidn defectuosa, moral de los empleados y el 
desarrollo de otros problemas. 

Recientemente, Ray Murdock fue nombrado como 
nuevo CEO (director ejecutivo), por parte de los principales 
accionistas de Minot. El eje de los esfuerzos renovadores 
de Murdock es poner todos los procesos de produccion al 
dfa con los estandares de calidad con los cuales se ha ido 
revolucionado la industria. 

El senor Murdock se da cuenta de que esto requiere un 
extraordinario trabajo de equipo de parte de todos sus 


funcionarios ejecutivos, como tambien del personal de lrnea, 
quienes en el pasado se habfan comprometido fielmente 
con las metas y aspiraciones de Minot Industries. 

En el pasado, Minot pudo mantener sus estandares de 
produccidn con poco esfuerzo y poca preocupacion por 
la calidad. Las materias primas utilizadas por su fuerza 
laboral capacitada garantizaba que Minot produjera un 
producto superior. Sin embargo, con la creciente 
competencia, tanto de las fuentes nacionales como de las 
extranjeras, mantener los estandares del producto a un 
costo razonable fue una meta mas esquiva, 

Restablecer a Minot como una industria lfder puede 
lograrse s 61 o mediante la aplicacion de metodos precisos 
de control de calidad. Este reto deben enfrentarlo los 
empleados leales, quienes estan dispuestos a ejecutar sus 
obligaciones profesionales. 


Carta X para Minot 



LSC = 9.665 


X = 7.070 


LIC * 4.475 


(Lfmite superior 
de control) 


(Lfmite inferior 
de control) 


Numero de muestra 


Carta R para Minot 



LSC = 11.91 


/? = 6.189 


LIC = 0.4679 


Numero de la muestra 
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15.1 Introduction 

Durante los ultimos anos el nivel de competencia nacional y extranjera se ha intensificado considerablemente. 
Este alto nivel de competencia entre las empresas comerciales ha creado la necesidad de vigilar y mantener la 
calidad de los productos. A medida que la competencia aumenta, se vuelve cada vez mas dificil adquirir y 
mantener una participacion de mercado suficiente como para permitir la subsistencia economica. Sin medidas 
cuidadosas para garantizar que sus productos cumplan con ciertas especificaciones mmimas, es menos probable 
que un negocio subsista a las duras condiciones competitivas del mercado actual. 

Este capitulo analiza las numerosas herramientas estadisticas que las empresas pueden utilizar para administrar 
un programa efectivo de regulation de la calidad total de sus productos, haciendolos por ende mas competitivos. 
Un programa de control de calidad de esta naturaleza generalmente confia ampliamente en tecnicas como: 

• Cartas de control para las variables: 

Cartas X 
Cartas R 

• Cartas de control para atributos 

Cartas p 
Cartas c 

• Curvas caracterfsticas de operation 

• Muestreo de aceptacion 


15.2 Breve historia del desarrollo mundial 
del control de calidad 

Antes de la revolucion industrial, la produccion era efectuada principalmente por artesanos especializados. Elios 
sentian tanto orgullo por su trabajo que con frecuencia firmaban cada pieza. Con el advenimiento de la revolucion 
industrial y el crecimiento del sistema de fabricas, la produccion se fragmento, sin que la responsabilidad del 
producto recayera con alguien en particular. Con mucha frecuencia, estos cambios en los metodos de produccion 
minimizaron la identification del trabajador con el producto, y afectaron el cuidado que antes se tenia para realizar 
un trabajo. Como resultado, la calidad de produccion y el cuidado de las necesidades del consumidor disminuyeron. 

A mediados de los anos veinte, Walter Shewhart, un investigador de Bell Laboratories, hizo un descubrimiento 
significativo en el area de mejoramiento de la produccion. Reconocio que aunque la variacion en los productos 
manufacturados era inevitable, esta variacion podrfa vigilarse y controlarse utilizando ciertos procesos estadisticos. 
Desarrollo una herramienta grafica simple, denominada carta de control , para determinar cuando su variacion 
excedia los limites aceptables. 

Durante la Segunda Guerra Mundial, la necesidad de la nation de gran cantidad de materiales de alta calidad, 
desperto un interes adicional en las cartas de control y herramientas estadisticas relacionadas, y promovio un 
interes general por el control de calidad. Sin embargo, no fue sino hasta los anos setenta, cuando los fabricantes 
de Estados Unidos enfrentaron la competencia implacable de un flujo de importaciones japonesas excelentes, que 
difundio ampliamente el interes por el control de calidad en los Estados Unidos. 

W. Edwards Deming estudio con Shewhart, luego ocupo un cargo en el Ministerio de Agricultura y 
posteriormente con la Census Bureau. Aunque ahora es reconocido mundialmente como uno de los pioneros en 
el campo del control de calidad, anteriormente solo los japoneses estudiaron seriamente sus ideas. Deming 
desarrollo toda una filosoffa de gerencia de calidad con base en sus “14 puntos”, los cuales establecen, entre 
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otras cosas, que con un clima organizacional apropiado, los metodos estadisticos de mejoramiento de procesos 
pueden reducir la variation a la que se referia Shewhart: reducir los costos considerablemente, mejorar la imagen 
organizacional asi como su situation financiera. Deming argumentaba que el desarrollo de la calidad era un 
proceso interminable y en curso, que requerfa una vigilancia continua del proceso de production. 

En 1951 Deming fue invitado a hablar ante el Gremio de Cientificos e Ingenieros Japoneses. Los japoneses 
estaban preocupados por la reputation que habfan adquirido por producir productos elaborados de forma m&s 
barata y de menor exportation. En una gran serie de conferencias y reuniones con los lideres japoneses tanto de 
la industria como del gobiemo, Deming convencio a los japoneses de escuchar al consumidor y aplicar los 
metodos estadisticos de control de calidad, para asi poder expandir su produccion y exportar a todo el mundo sus 
productos de alta calidad. Las ideas y ensenanzas de Deming fueron un instrumento para situar a los japoneses 
en la envidiable position que gozan hoy dia como potencia economica mundial. En su honor, los japoneses 
instituyeron el premio Deming, el cual se otorga a las companias que han sido reconocidas por su mejoramiento 
sobresaliente en calidad. 


Tabla 15.1 

Analisis de categori'as /arti'culos 

Valor en puntos 

Criterios 

1 . Liderazgo 


110 

del Premio 

1.1 Sistema de liderazgo 

80 


de Calidad Nacional 

1.2 Responsabilidad de la compania y ciudadama 

30 


Malcom Baldrige 

2. Planeacion estrategica 


80 


2.1 Proceso de desarrollo de estrategias 

40 



2.2 Estrategia de la compania 

40 



3. Cliente y foco del mercado 


80 


3.1 Cliente y conocimiento del mercado 

40 



3.2 Satisfaccion del cliente y mejoramiento de la relacion 

40 



4. Informacion y analisis 


80 


4.1 Seleccion y uso de informacion y datos 

25 



4.2 Seleccion y uso de informacion y datos comparativos 

15 



4.3 Analisis y revision del desempeno de la compania 

40 



5. Desarrollo y manejo de recursos humanos 


100 


5.1 Sistemas de trabajo 

40 



5.2 Educacion de empleados, capacitacion y desarrollo 

30 



5.3 Bienestar y satisfaccion de los empleados 

30 



6. Manejo del proceso 


100 


6.1 Manejo del producto y procesos de servicio 

60 



6.2 Manejo de los procesos de apoyo 

20 



6.3 Manejo de procesos de proveedores y asociaciones 

20 



7. Resultados del negocio 


450 


7.1 Resultados de la satisfaccion del cliente 

130 



7.2 Resultados financieros y del mercado 

130 



7.3 Resultados del re curso humano 

35 



7.4 Resultados de proveedor y socio 

25 



7.5 Resultados especificos de la compania 

130 



PUNTOS TOTALES 


1 ,000 


Fuente: 1997 Award Criteria. Premio Nacional de Calidad Malcom Baldrige, Ministerio de 
Comercio de Estados Unidos. 
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Joseph Juran fue reconocido por difundir los beneficios del control de calidad entre los japoneses. A1 igual 
que Deming, Juran argumento que un compromiso de la alta gerencia con el control de calidad, era esencial. 
Establecio que la calidad era responsabilidad de los gerentes y que se deberfa atender como cualquier otra area 
funcional asi como finanzas o marketing. 

Se han desarrollado muchos premios en la industria norteamericana. Quiza el mas notable es el Premio Nacional 
de Calidad Malcom Baldrige, instituido en 1988 y bautizado en honor al Secretario de Comercio de Estados Unidos 
desde 1981 hasta su muerte en 1987, esta distincion esta disenada para reconocer a las empresas que presentan 
un compromiso con la excelencia del producto. Dentro de los ganadores anteriores se encuentran Motorola 
(1988); Xerox (1989); IBM, Federal Express y Cadillac (1990). La tabla 15.1 muestra los criterios especfficos 
utilizados para determinar los ganadores. Con base en estos criterios, los ganadores del premio en 1 997 fueron 3M 
Dental Products Division; Merrill Lynch Credit Corporation; Xerox Business Services y Solectron Corporation, 
un disenador y fabricante de equipos de alta tecnologfa. 

En otra seccion de este capftulo se analizaran muchas de las herramientas utiles a la gerencia de calidad. 
Comenzaremos con las cartas de control desarrolladas por Walter Shewhart. 


1 5.3 Cartas de control para variables 

Las cartas de control se utilizan comunmente para vigilar la calidad de un producto en un proceso de fabricacion 
en curso. Permiten que el experto en control de calidad observe muy de cerca toda variacion en el proceso, y alerte 
al fabricante respecto a los cambios en la naturaleza del producto. Esto ayuda a garantizar que el producto cumpla 
con deltas especificaciones de fabricacion y estandares de calidad. 

Casi todas las empresas manufactureras siguen programas de control de calidad. El proposito es detectar, tan 
pronto como sea posible, toda variacion en las caracterfsticas importantes de un producto, como su tamano, peso, 
tono de color, o en el caso de recipientes, su nivel de contenido. Dicha variacion tiene dos fuentes: 1) variacion 
aleatoria (o comun), y 2) variacion asignable a una causa. La variacion aleatoria ocurre simplemente porque, al 
igual que los copos de nieve, dos articulos cualquiera no son identicos. Las diferencias naturales son de esperarse 
y producen problemas no reales en terminos de controlar el nivel de calidad de un producto. Cada producto 
contiene alguna leve variacion inherente. 


Variacion aleatoria Pequenas variaciones en el producto o en el proceso de produccion 
son de esperarse, debido a la diferencia inherente a los insumos de produccion utilizados 
en el proceso de produccion. 


Sin embargo, una variacion de causa asignable es una variacion excedente a toda diferencia natural. Se debe a 
alguna causa especffica que puede (y debe) identificarse y corregirse. Una variacion de causa asignable termina 
en productos defectuosos y sugiere que el proceso de produccion esta “fuera de control”. Es producido por un 
error humano, un dispositivo mecanico defectuoso utilizado en el proceso de produccion u otro procedimiento. 


Variacion de causa asignable Variacion en el producto o el proceso de produccion 
que sefiala que el proceso esta fuera de control y que se requieren medidas correctivas. 


Al recolectar los datos para un estudio de control de calidad, es comun tomar una serie de muestras a traves 
del tiempo durante el proceso de produccion. Se sugiere que el numero de muestras recolectadas, k, deberfa ser 
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de por lo menos 20, y el tamano de cada muestra, n, debe estar entre 5 y 15. Cada muestra se denomina un 

subgrupo. 

A1 seleccionar cada muestra, con frecuencia es necesario tener en cuenta el subagrupamiento racional. Esto 
requiere que se seleccione cada muestra de tal manera que se garantice que la fuerza que causa la variacion ocurra 
entre muestras, y no dentro de las muestras. Asf, ninguna de las observaciones de la muestra antes del comienzo 
de la fuerza causal se vera afectada, mientras que todas las observaciones de la muestra despues del comienzo, 
estan sujetas a la variacion producida por la fuerza. 

Por ejemplo, FCI Telemarketing utiliza un “cuarto caliente” para comercializar los productos y los servicios de 
sus clientes. Un cuarto caliente contiene un gran banco de telefonos desde donde los operadores llaman al 
maximo numero posible de clientes potenciales y entregan un lanzamiento de ventas esperando obtener pedidos. 
A los operadores se les califica en parte por la velocidad con la cual terminan las llamadas. Para evitar el aburrimiento, 
los operadores trabajan solo por una hora; luego un nuevo tumo de trabajadores rota. Para detectar toda diferencia 
en el desempeno del operador, las muestras deberfan seleccionarse dentro de una hora dada. No deberfa abarcar 
dos o mas tumos de trabajadores. Por tanto, toda diferencia en las medias que este mas alia de la variacion 
aleatoria puede asignarse a la fuerza esperada -en este caso, un cambio en personal. 

Eastman-Kodak fabrica un obturador para sus camaras, los cuales deben cumplir especificaciones de produccion 
muy precisas. El dispositivo debe medir 0.94 centfmetros (cm), con una tolerancia permisible de 0.03 cm. Es decir, 
su rango aceptable esta entre de 0.9 1 a 0.97 cm. Las medidas se toman periodicamente y los resultados se registran 
en una carta de control. De esta manera puede determinarse rapidamente si el mecanismo de obturacion esta 
cumpliendo o no con las especificaciones de produccion. 

Se asume por ahora que el proceso esta bajo perfecto control, produciendo una media de 0.94 cm, con una 
desviacidn estandar de 0.01 cm. La figura 15.1(a) ilustra esta condition. Se observa que 99.7% de todos los 


Figura 15.1 

Resultado de un 
cambio en la media 
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mecanismos estan dentro de las especificaciones de production. El 0.03% restante son defectuosos debido solo 
a una variation aleatoria. 

La figura 15.1(b) muestra el resultado de un proceso que esta fuera de control y esta produciendo una media 
mayor que 0.94 cm (se asume que la desviacion estandar sigue siendo 0.01). Esto puede ocurrir si, por ejemplo, la 
maquina utilizada en el proceso de production sufrio un desgaste inusual. El area de la figura 15. 1(b) que esta por 
encima de 0.97 cm, representa el porcentaje de defectos por variation de causa asignable, en este caso, el 
desgaste de la maquina. 

El desgaste de la maquina tambien es probable que ocasione que el proceso se saiga de control produciendo 
una media inferior a 0.94 cm, como se observa en la figura 15.1 (c). De nuevo, el area por debajo de 0.91 cm 
representa la proportion de production no aceptable, debido a una causa asignable. 

La figura 15.2 ilustra el impacto de un cambio en la dispersion. La figura 15.2(a) representa un proceso bajo 
control, con una media de 0.94 cm y una desviacion estandar aceptable. Sin embargo, por ejemplo, la fatiga del 
trabajador, con el tiempo, puede resultar en una production que varfa considerablemente de una unidad a otra 
unidad. Los resultados de esta desviacion aumentada se muestran en la figura 15.2(b). Asumiendo que la media 
no ha cambiado, el proceso esta fuera de control debido a una variation excesiva en la dispersion. Las unidades 
que estan por encima de 0.97 cm y por debajo de 0.91 cm son defectuosas. Claro que es posible, tanto para la 
ubicacion como para la dispersion, salirse de control al mismo tiempo. 


Figura 15.2 

Resultado del cambio 
en la dispersion 



A diferencia de la figura 15.2 que muestra la situation del proceso de production en un punto en el tiempo, las 
cartas de control con frecuencia representan medidas a traves del tiempo. La figura 15.3 ilustra cuatro formas 
diferentes en que un proceso puede salirse de control con el tiempo. Se dice que la figura 15.3 (a) resulta de un 
efecto de “choque” ya que el cambio subito de localization puede probablemente atribuirse a alguna ocurrencia 
que ha ocurrido abruptamente. Un cambio de tumo en el cual un trabajador no experimentado entra a trabajar, o el 
cambio repentino de materia prima de inferior calidad , puede producir tal ocurrencia. En todo caso, en el que la 
variation de causa asignable (en la media) ha sido identificado, se deben tomar medidas para ubicar y corregir la 
causa de esta variation. 

Tanto la figura 15.3(b) como la 15.3(c) sugieren una perdida de control mas gradual. La causa puede ser el 
desgaste progresivo de la maquina. En primera instancia, la variation en la dispersion hace que se pierda el control 
del proceso; en segunda instancia, el control se pierde debido a una tendencia ascendente en la media. De nuevo, 
deben tomarse acciones correctivas. Finalmente, la figura 15.3 (cf) indica una perdida de control como resultado de 
la variation de causa asignable tanto en la media (ubicacion) como en la dispersion. 
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Figura 15.3 

Patrones en las medias 
y dispersion que indica 
perdida de control 


Efecto de “choque” 






1 5.4 Cartas de control para la media y la dispersion 

Las cartas de control ayudan a la detection de la variacion de causa asignable. Se forman diferentes tipos de 
cartas de control para al menos dos variables. El primer tipo, con frecuencia denominada carta X , se disena para 
medir la variacion en las medias muestrales. El segundo tipo mide la variacion en el rango de las muestras. 
Logicamente, se le denomina carta R . A continuacion se presenta un analisis de ambos tipos de cartas. 
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A. La carta X 

La tipica carta X se utiliza para medir la variation de las medias muestrales alrededor de algun nivel generalmente 
aceptado. Como lo indica la figura 15.4, un lfmite superior de control (LSC X ) y un lfmite inferior de control (LIC X ) 
se establecen alrededor de una medida aceptable, la cual se determina como la gran media, X , de varias medias 
muestrales. El valor X sirve como estimation de (a. 


Figura 15.4 

La carta X 



Si las medias muestrales caen dentro de un rango aceptable, como se muestra en la figura 15.4, solo se dice que 
la variation aleatoria ocurre. Sin embargo, si las medias muestrales exceden el LSC x o caen por debajo del LIC X , el 
proceso de control de calidad ha detectado una variation de causa asignable, y el proceso de production queda 
fuera de control. Debe determinarse y corregirse la causa de esta variation excesiva 

Es habitual en los procedimientos de control de calidad determinar el LSC^y el LIC X , por encima y por debajo 
de X. Esta costumbre resulta de la regia empfrica que establece que 99.7% de todas las observaciones en una 
distribution normal estaran dentro de ese rango. 

Por tanto. 


Lfmite superior de control 
para las medias 

LSC* = X + 3ffj 

[15.1] 

y> 



Limite inferior de control 


[15.2] 

para las medias 

LIC^ = X — 3cr ~ 


Sin embargo, en la practica, se estima 3cl como Ajl, en donde R es el rango promedio de los rangos muestrales, 
y A 2 es una constante basada en el tamano de la muestra. Los valores A 2 pueden hallarse en el apendice III, tabla 
O. Utilizando A 2 R en lugar de 3 g_ produce resultados similares y es considerablemente mas facil de calcular. Se 
tiene entonces: 


Lfmite superior de control 
para medias 


LSC* = X + A 2 R 


[15.3] 
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Limite inferior de control 
para medias 


UCz = X - a 2 r 


[15.4] 


Consideremos el problema enfrentado por Janet Lugg, director de medidas de control de calidad para AT&T. 
Su planta produce las estructuras para los computadores de mesa, los cuales deben cumplir ciertas especificaciones 
de tamano. Para garantizar que se cumplan estos estandares, Janet recolecta K = 24 muestras (subgrupos), cada 
uno de tamano n = 6, y mide su ancho. Los resultados aparecen en la tabla 15.2. 


Tabla 15.2 

Medidas en centimetros 
de los computadores 
de mesa AT&T (K = 24, 
n = 6] 


Muestra Medidas muestrales X R 


1 

15.2 

14.5 

15.4 

16.5 

15.9 

16.2 

15.6170 

2.0 

2 

16.2 

15.4 

15.9 

15.2 

15.2 

14.5 

15.4000 

1.7 

3 

15.6 

16.5 

15.9 

16.2 

15.9 

16.2 

16.0500 

0.9 

4 

18.5 

14.8 

15.7 

15.2 

16.8 

14.2 

1 5.8667 

4.3 

5 

17.5 

15.7 

14.5 

14.2 

14.5 

15.2 

15.2667 

3.3 

6 

14.3 

15.9 

16.5 

14.8 

15.4 

14.8 

15.2833 

2.2 

7 

15.4 

15.2 

15.4 

15.8 

14.2 

15.7 

15.2833 

1.6 

8 

18.0 

14.5 

14.4 

16.2 

14.8 

16.8 

15.7833 

3.6 

9 

14.2 

15.6 

14.5 

16.1 

15.7 

15.9 

15.3333 

1.9 

10 

15.7 

16.5 

14.5 

14.8 

16.8 

16.1 

15.7333 

2.3 

11 

14.8 

14.5 

16.5 

14.9 

15.8 

16.3 

15.4667 

2.0 

12 

16.8 

15.8 

15.2 

15.8 

15.7 

16.2 

15.9167 

1.6 

13 

15.2 

15.9 

14.5 

15.1 

15.9 

14.7 

15.2167 

1.4 

14 

15.4 

15.7 

16.8 

15.3 

14.8 

14.9 

15.4833 

2.0 

15 

18.4 

15.7 

15.9 

14.8 

15.5 

14.8 

15.8500 

3.6 

16 

16.5 

16.8 

15.0 

15.7 

16.9 

14.7 

15.9333 

2.2 

17 

15.2 

16.9 

16.8 

17.0 

17.1 

15.4 

16.4000 

1.9 

18 

16.8 

17.2 

18.9 

18.5 

18.5 

18.9 

18.1333 

2.1 

19 

13.5 

17.6 

18.7 

21.1 

17.2 

16.0 

17.3500 

7.6 

20 

19.8 

14.5 

20.8 

19.2 

19.2 

18.7 

18.7000 

6.3 

21 

18.7 

17.9 

18.7 

20.8 

18.4 

17.5 

18.6667 

3.3 

22 

17.5 

18.0 

18.2 

20.2 

14.2 

17.8 

17.6500 

6.0 

23 

14.9 

18.9 

20.0 

16.8 

16.2 

18.5 

17.5500 

5.1 

24 

18.7 

17.9 

17.4 

18.7 

17.2 

16.5 

17.7333 

2.2 


- _ 2X _ 15.6170 + 15.4000 + • • • + 17.7333 

K 24 

= 16.3194 

- Sfl 2.0 + 1.7 + ••• +2.2 

* " K ~ 24 

= 2.9625 
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La media y el rango de cada muestra aparecen en las dos ultimas columnas de la tabla. La gran media y el rango 
promedio se calculan. Con esta informacion puede determinarse el LSC y el LIC paraX . Debido a que cada tamano 
muestral es n = 6, la tabla 0 del apendice III re vela que A 2 es 0.483. Entonces: 

LSC^ = X + A 2 R 

= 16.3194 + (0.483X2.9625) 

= 17.75 

LIC* = f - A 2 R 
= 14.89 

La figura 15.5, la cual se hizo en Minitab, es la carta de control de Janet Lugg. Vale la pena notar que las medias 
para los subgrupos 18, 20 y 21 revelan que el proceso esta fuera de control: las medias se han incrementado a 
niveles que superan el LSC, indicando la presencia de variacion de causa asignable. Quizas con el tiempo las 
maquinas que producen las piezas del computador han sufrido un desgaste poco usual, produciendo un desempeno 
inadecuado. O la variacion puede haber sido causada por la introduction de materia prima de calidad inferior 
obtenidos de un nuevo proveedor alrededor del tiempo en que se tomo la muestra 18. En todo caso, la Srta. Lugg 
debe ubicar y corregir la causa para la variacion inaceptable. 


Figura 15.5 

Carta X para Janet 
Lugg 


Carta X para los computadores AT&T 


LSC = 17.83 

f = 16.32 

LIC = 14.81 

0 5 10 15 20 25 

Numero de muestras 



B. La carta R 

Ademas de vigilar los cambios en la media, es util hacer el escrutinio de la variacion en el proceso. Aunque la 
desviacion estandar es una medida que depende de la dispersion, las tecnicas de control de calidad generalmente 
conffan en el rango como un indicio de la variabilidad del proceso. El rango es mas facil de calcular, y la entienden 
mas rapidamente quienes no tienen antecedentes estadisticos suficientes. 

Se calcula un limite inferior de control (LIC R ) y el limite superior de control (LSC R ) para el rango; al igual que 
con los de la carta X, hay tres errores estandar por encima y por debajo de la media. En principio, se determinan asi: 


Limite superior de control 
para el rango 


LSQ — R + 3 s R 


[15.5] 
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Li'mite inferior de control 
para el rango 

LIC k = R — 3 s R 

[15.6] 

en donde s R es la desviacion estandar en los rangos muestrales. Sin embargo, en la practica, 
utilizar: 

es mas simple de 

Limite superior de control 
para el rango 

LSC* = D a R 

[15.7] 

y> 

Limite inferior de control 
para el rango 

UC* = D 3 R 

[15.8] 


Los valores para D A y D } se toman del apendice II, tabla O. 

Utilizando los datos de Lugg de la tabla 15.2, se tiene que: 

LSC r = (2.004) (2.9625) = 5.936 
LIC R =(0) (2.9625) = 0 

La carta R presentada en la figura 15.6 se genero utilizando Minitab. Se nota de nuevo que las ultimas muestras 
indican que el proceso esta fuera de control: los valores R para las muestras 19, 20 y 22 exceden el LSC. Debe 
tomarse una action a seguir para identificar y corregir la fuente de la variacion de causa asignable. 


Figura 15.6 

Carta R para Janet 
Lugg 



UCL - 5.93 


R - 2.96 


LCL = 0.000 


A1 examinar las cartas X y R, la senorita Lugg determina que el proceso esta fuera de control. Es comun utilizar 
ambas cartas conjuntamente en el esfuerzo por detectar los problemas de control. Un proceso puede presentar 
una media estable que permanece dentro del control estadistico, pero la variacion alrededor de la media, como la 
mide la desviacion estandar o el rango es tan grande, que la mayoria de las unidades son defectuosas. Por 
ejemplo, un proceso puede estar disenado para producir unidades de 10 pies de longitud. En la mitad de ellos hay 
una longitud de 5 pies y en la otra mitad de 15 pies, la media deseada de 10 pies se mantiene, pero ninguna de las 
unidades son aceptables o son demasiado largas o demasiado cortas. Los procesos deberfan operar de manera 
que se produzca tanto una media estable como una variacion estable. Asi, las cartas R y las cartas X se utilizan 
mejor en conjunto. 
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De hecho, con frecuencia se sugiere que la carta R se deberfa construir e interpretar primero. Se recuerda que 
la carta X depende del rango (ver formulas [15.3] y [15.4]. Por tanto, si la variacion del proceso en cuanto a 
dispersion esta fuera de control, los limites de control sobre la carta X tienen poco significado. Si la carta R indica 
que la variacion del proceso esta bajo control, solo entonces tiene sentido construir e interpretar la carta de 
medias. El ejemplo 15.1 ilustra esta practica. 


Ejemplo 15.1 

En diciembre de 1997, GTW Electronics, una empresa pequena de New Jersey, anuncio su intention 
de competir directamente con General Electric en la fabrication de ciertos componentes electricos. 
El director ejecutivo de GTW exigio chequeos de control de calidad disenados para medir la variacion 
en el peso de uno de los componentes. Se tomaron las muestras de tamano n - 6 cada hora para K 
= 5 horas. Los resultados en onzas se tabulan a continuation. Si el estudio de control sugiere una 
variacion inaceptable, el director ejecutivo ha emitido una orden perentoria de que el proceso de 
production debe detenerse hasta que se identifique y se corrija la causa asignable. 


Hora ( a . m .) 

1 

2 

3 

4 

5 

6 

X 

R 

8:00 

4.9 

4.8 

4.8 

5.1 

6.6 

5.2 

5.23 

1.8 

9:00 

6.8 

5.1 

5.2 

7.1 

5.3 

5.2 

5.78 

2.0 

10:00 

7.1 

6.9 

5.9 

6.2 

6.9 

6.9 

6.65 

1.2 

11:00 

6.8 

6.2 

6.5 

7.1 

7.6 

6.8 

6.83 

1.4 

12:00 

X = 5.87 

6.0 

4.6 

4.5 

4.5 

4.3 

5.2 

4.85 

29.34 

1.7 

8.1 


R= 1.61 


Aunque K = 5 probablemente es insuficiente (se recuerda que se sugiere que K > 20), su uso 
simplificara la aritmetica en la ilustracion. 


Solution 


LSC* = D 4 R 

= (2.004X1.62) 
= 3.25 
UC R = DJR 
= (0X1.62) 

= 0 


Asf, la carta R aparece como 



1 2 3 4 5 



532 


ESTADISTICA APLICADA A LOS NE60CI0S Y LA ECONOMIA 


Debido a que la carta R sugiere que la variacion en R esta bajo control, la carta X puede construirse 
para probar la variacion en las medias: 

L SC* = X + A 2 R 

= 5.87 + (0.483)(1.62) 

= 6.65 

UCx = X - A 2 R 
= 5.09 

La carta X se vuelve 



Interpretation 

Se puede observar que el proceso esta fuera de control. Las medias para las muestras 3 y 4 exceden 
el LSC. El proceso de production debena interrumpirse y la causa asignable deberfa identificarse y 
corregirse. 


Ejercicios de la seccion 


1. Se tomaron siete muestras de tamano 5 para las libras contenidas por pulgada cuadrada en los contenedores 
presurizados. ^Parece que el sistema esta fuera de control con base en las cartas X y en las cartas R ? 


Muestra 

1 

2 

3 

4 

5 

6 

7 

25.00 

35.00 

22.00 

24.00 

27.00 

21.00 

31.00 

29.00 

31.00 

29.00 

30.00 

19.00 

23.00 

30.00 

27.00 

29.00 

27.00 

31.00 

18.00 

22.00 

21.00 

31.00 

27.00 

24.00 

21.00 

27.00 

25.00 

22.00 

27.00 

25.00 

20.00 

26.00 

20.00 

35.00 

31.00 


2. La resistencia a la tension del cable se mide en libras, tomando 10 muestras de tamano 4 cada una. Examine el 
control estadistico utilizando una carta X y una carta R. 


1 

2 

3 

4 

5 

10 

19 

14 

18 

8 

2 

18 

12 

19 

9 

15 

21 

10 

14 

6 

13 

23 

9 

15 

6 


6 

7 

8 

9 

10 

15 

23 

18 

21 

19 

17 

15 

17 

18 

21 

18 

14 

15 

15 

22 

14 

16 

15 

14 

14 


Muestra 
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3. Se seleccionan cinco muestras de tamano 7, produciendo: 

*i=6.2 X 2 = 7.3 f 3 = 8.1 X 4 = 7.2 X 5 = 6.3 

y. 

*, = 1.5 * 2 — 1.7 rt 3 =1.9 *4=1.2 *5=U 

Determine los lfmites superior e inferior para una carta X y una carta *. ^E1 proceso esta bajo control? 


4 . Rector Public Accounting concluyo que los tiempos para terminar las auditorfas deberfan ser estandar. Se 
seleccionaron diez auditorfas para las cinco oficinas de Rector ubicadas en almacenes. Con base en los 
resultados mostrados aquf, construya e interprete las cartas de control apropiadas para determinar si los 
tiempos de termination estan bajo control. 


Muestra 

1 

2 

3 

4 

5 

4.10 

10.5 

9.70 

7.80 

15.70 

3.20 

15.00 

11.90 

9.50 

8.90 

3.60 

6.00 

12.00 

6.90 

7.80 

5.60 

9.00 

5.80 

5.80 

7.60 

6.30 

8.00 

6.90 

4.80 

6.80 

5.20 

5.60 

14.80 

7.20 

5.90 

6.70 

3.90 

21.80 

15.30 

3.60 

9.90 

7.20 

10.90 

14.20 

5.80 

8.70 

5.50 

10.80 

15.90 

4.10 

8.80 

6.80 

12.80 

13.60 

5.60 


1 5.5 Cartas de control para atributos 

Las cartas de control para X y R estan disenadas para monitorear los datos cuantitativos de un proceso. En 
muchos casos es necesario y deseable medir la calidad de un proceso, o la production de dicho proceso, con 
base en la aceptacion de un atributo. Este procedimiento estadistico determina si un proceso es aceptable con 
base en la proporcion y el niimero de defectos. Dos tipos comunes de cartas de control se concentran en la 
aceptabilidad: las cartas p miden la proporcion de defectos, y las cartas c registran el numero de defectos por 
articulo. 


A. Cartas p 

En la construction de las cartas p simplemente se toma nota de la proporcion de articulos defectuosos en una 
muestra. Esta proporcion, p es: 

v n Numero de defectos en una muestra 


Tamano de la muestra 
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De la misma manera que con las cartas de control para las variables, se toman varias muestras, produciendo varios 
valores para p. La proporcion media de defectos para estas varias muestras, p se calcula luego asi 

_ Numero total de defectos en todas las muestras 

p _ - - 

Numero total de todos los articulos inspeccionados 

El valor p sirve como el estimado de 71, la proporcion de defectos poblacional, en caso de que Jt sea desconocido. 
La desviacion estandar de la proporcion de defectos es 


Desviacion estandar C(T - rr) 

de la proporcion de defectos V « 


[15.9] 


En el caso probable que 7t sea desconocido, <7 se estima mediante s , en donde 


Desviacion estandar para la proporcion = p( 1 - p) 

de defectos cuando a es desconocido p V n 


[15.10] 


Recuerde la explication anterior sobre distribution binomial, en la cual la detection de defectos se basa en los 
procesos de Bernoulli. 

Los limites superiores de control (LSC ) y los limites inferiores de control (LIC ) se forman a tres desviaciones 
estandar por encima y por debajo de la poblacion de defectos. Si n es conocido: 


■ , .. . , . . LSCn = tt + 3cr 

Limite superior de control 

para las proporciones = „ + 3 ^ 

jnil — 7 r) [1 5.11] 

n 

y 

Limite inferior de control n 3<r p 

para proporciones = _ 3 ^ 

7 r( 1 — 7 r) [15.12] 

n 

Si k es desconocido, 

Limite superior de control ^ SC ' > p + 3i 

para proporciones = - + 

jp( 1 - p) [15.13] 

y. 

Limite inferior de control UCp p 3Sp 

para proporciones =p-3\ 

p(l -p) [1 5.1 4] 

n 
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Opus, Inc. fabrica guitarras electricas y otros instrumentos musicales. Un procedimiento de control de calidad 
para detectar los defectos en el modelo 1000 de la guitarra “Auditory Annihilator” comprende la selection de K= 
15 muestras diferentes de tamano n= 40. El numero de defectos en cada muestra se muestra en la tabla 15.3. Se 
inspecciona un total de (15)(40) = 600 guitarras. 


Tabla 15.3 

Muestra 

Numero de defectos 

P 

Muestra 

Numero de defectos 

P 

Defectos en K = 15 

1 

10 

0.250 

9 

13 

0.325 

muestras 

2 

12 

0.300 

10 

15 

0.375 

de tamano n = 40 

3 

9 

0.225 

11 

17 

0.425 


4 

15 

0.375 

12 

3 

0.075 


5 

27 

0.675 

13 

25 

0.625 


6 

8 

0.200 

14 

18 

0.450 


7 

11 

0.275 

15 

17 

0.425 


8 

11 

0.275 
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Con estos datos, un especialista en control de calidad para Opus encuentra que: 



- 0.3517 


Entonces 


Lsc - =ii+3i /^V^ 

= 0.35,7 + V 0351 ^ ' 
= 0.5782 


UC P = P - 
= 0.1252 


P(i ~ P ) 
n 


Una carta de control preliminar se crea a partir de estos hallazgos, como en la figura 15.7, la cual fue elaborada 
en Minitab. 


Figura 15.7 

Carta p para Opus, 
Inc. 


Carta p para Opus, Inc. 

LSC = 0.5782 

P-0.3517 

LIC =0.1252 

0 5 10 15 

Numero de la muestra 
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Las muestras 5 (p = 0.675), 12 (p = 0.075), y 13 {p- 0.625) estan claramente fuera de control. La busqueda de 
causas asignables revelaron que se tomo la muestra 5 durante un tiempo en el que cierto personal clave estaba de 
vacaciones, y empleados menos habiles fueron obligados a reemplazarlos. La inusual baja proporcion de defectos 
para la muestra 12 pro vino de la utilizacion, en una sola oportunidad, de materias primas superiores, cuando el 
proveedor regular no pudo suministrar a Opus los materiales usuales. La muestra 13 se tomo cuando la nueva 
construction de la planta interrumpio temporalmente el fluido electrico, no permitiendo el uso de metodos de 
production computarizados. 

La causa asignable se ha identificado para cada anomalia. Si se desea, puede seguirse un curso de action para 
prevenir la recurrencia. Por ejemplo Opus puede garantizar que en el futuro el personal clave planee sus vacaciones 
para evitar una repetition de la muestra 5. 

Se presume que un LICp no serfa problema, debido a que es deseable las bajas tasas de defectos. Sin embargo, 
los inusuales valores bajos de p pueden ayudar a identificar las formas en las que se pueden minimizar los 
defectos. Por ejemplo, Opus puede desear tener en consideration el uso regular de materia prima superior obtenida 
de la muestra 12, si no son imposibles los costos. Quiza deberfa hacerse un estudio para comparar el efecto en las 
utilidades de usar materia prima de alto grado. Ademas, excepcionalmente los valores bajos de p pueden indicar 
un problema debido a que el programa de control de calidad sencillamente no esta detectando efectivamente los 
defectos. 


Ejemplo 15.2 

Home Mortgage Company procesa creditos para vivienda para los residentes en el centro de 
Illinois. El Sr. Mooney, presidente de la compama, fue alertado por un nuevo funcionario de creditos 
respecto a que los empleados que deben proporcionar la aprobacion final del crddito no han 
detectado algunos errores en las solicitudes de crddito. Debido a que la falta de cuidado podrfa 
resultar muy costosa, el Sr. Mooney selecciona 25 muestras de solicitudes que han recibido 
aprobacion. Cada muestra tiene 50 solicitudes. Despues de revisar personalmente cada solicitud, el 
Sr. Mooney encuentra que cada muestra contiene solicitudes que no deberfan haber sido aceptadas. 
Registra el numero de tales solicitudes para cada muestra. Con base en lo hallado, el Sr. Mooney le 
pide crear una carta p y hacer comentarios sobre los resultados: 


Muestra 

Numero de solicitudes 

con errores 

Proporcion 

Muestra 

Numero de solicitudes 

con errores 

Proporcion 

1 

8 

0.16 

14 

5 

0.10 

2 

12 

0.24 

15 

6 

0.12 

3 

2 

0.04 

16 

8 

0.16 

4 

5 

0.10 

17 

7 

0.14 

5 

6 

0.12 

18 

7 

0.14 

6 

6 

0.12 

19 

6 

0.12 

7 

15 

0.30 

20 

9 

0.18 

8 

8 

0.16 

21 

8 

0.16 

9 

7 

0.14 

22 

15 

0.30 

10 

7 

0.14 

23 

6 

0.12 

11 

5 

0.10 

24 

6 

0.12 

12 

21 

0.42 

25 

8 

0.16 

13 

23 

0.46 


216 
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Solucion 

El numero total de solicitudes que presentaron errores fue de 216, y el numero total de solicitudes 
revisadas fue de 25 X 50 = 1 ,250. Por tanto, p = 21 6/1 ,250 = 0. 1728. El lfmite superior se halla 


LSC„ = 0.1728 + 3 


(0.1728X0.8272) 


50 


= 0.3332 


El lfmite inferior es: 


UCp = 0.1728 - 3 
= 0.0124 


(0.1728X0.8272) 


50 


Esto se observa con la carta p adjunta 



Cualquiera de las muestras con mas del 33.32% de solicitudes o menos de 1.24% de las solicitudes 
con error indican que el proceso de aprobacion esta fuera de control. 

Interpretation 

Las muestras 12 y 13 revelan que el proceso esta fuera de control. El Sr. Mooney deberfa considerar 
acciones para mejorar la forma en la cual se deben revisar los creditos para aprobacion. 


B. Cartas c 

Un segundo tipo de carta de control es la carta c, disenada para detectar el numero de defectos en una sola unidad. 
A1 desarrollar una carta p una unidad completa se consideraba defectuosa o no defectuosa. Sin embargo, en 
muchos casos, la presencia de uno o mas defectos puede no producir necesariamente una unidad inaceptable. Un 
fabricante de muebles puede encontrar defectos menores en un sofa y sin embargo no considerarlo inaceptable. 
Si los defectos por cada 100 yardas cuadradas de tapetes para el piso fueran pocas y menores, el fabricante puede 
decidir ofrecerlos en venta a pesar de estas imperfecciones. Una carta c se utiliza para analizar el numero de 
imperfecciones por unidad de production. 

La carta c tiene que ver con el numero de imperfecciones (defectos) por unidad (por sofa o por cada 100 yardas 
cuadradas). Esta consideration se ajusta a la distribution de Poisson. 

Los limites de control se establecen alrededor del numero de defectos en la poblacion, c. En el caso probable 
de que c sea desconocido, se estima mediante c, el numero promedio de defectos en las unidades. 
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Una unidad puede constar de un solo articulo como un sofa, o una pieza de tapete de 100 yardas cuadradas, 
o por ejemplo puede contener, un envio de 50 paginas impresas en las cuales se detectaron errores tipogr&ficos. 
La unidad debe ser consistente en tamano, numero o area. Anteriormente se definio la desviacion est&ndar del 
numero de ocurrencias como la raiz cuadrada del numero promedio de defecto. Asi: 


Desviacion estandar para 
el numero de defectos 

S c=Vc 

[15.15] 

Los limites de control estan a tres desviaciones estandar por encima y por debajo de c. 

Limite superior de control 
para el numero de defectos 

LSC, = c + 3s z 

[15.16] 

y, 

Limite inferior de control 
para el numero de defectos 

HQ = c - 3s- c 

[15.17] 


International Paper inspecciono 20 hojas de un nuevo tipo de papel regalo para buscar defectos. Los resultados 
se observan en la tabla 15.4. Se va a construir una carta c. 


_ 152 

C " 20 
- 7.6 
= VT6 
= 2.757 

LSC c = c + 3s d 

= 7.6 + 3(2.757) 
= 15.87 
OC c = c — 3s- c 
= -0.67 


La figura 15.8 contiene una carta c que se produjo usando Minitab. 

Las unidades 5 y 20 indican cuando el proceso esta fuera de control y la causa(s) asignables que se pudieron 
establecer. Si LIC c < 0, esto es igual a 0, por tanto un numero negativo de defectos es imposible. 

El ejemplo 15.3 ilustra ademas el uso de una carta c. 
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Tabla 15.4 

Numero de defectos 
en 20 piezas 
de papel regalo 


Figura 15.8 

Carta c para el easo 
International Paper 


Hoja 

Numero de defectos 

Hoja 

Nunero de defectos 

1 

5 

11 

3 

2 

4 

12 

15 

3 

3 

13 

10 

4 

5 

14 

8 

5 

16 

15 

4 

6 

1 

16 

2 

7 

8 

17 

10 

8 

9 

18 

12 

9 

9 

19 

7 

10 

4 

20 

17 

152 



Numero de la muestra 


Ejemplo 15.3 

Sammy Bates, el nuevo jefe de personal de Bates Electronics, ha introducido recientemente una 
estrategia para controlar el numero de empleados que no se reportan al trabajo cada dia. Para probar 
la efectividad del procedimiento, se seleccionan 20 dias aleatoriamente y se registran los numeros 
de trabajadores ausentes: 

Dfa Numero de ausencias Di'a Numero de ausencias 



11 5 

12 6 

13 5 

14 8 

15 7 

16 5 

17 6 

18 3 

19 5 

20 6 


92 
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El Sr. Bates debe construir una carta c para evaluar el nuevo sistema 


Solucion 

Debido a que un total de 92 empleados estuvieron ausentes durante un perfodo de 20 dias, c = 92/ 
90 = 1 .02. Entonces, 

UCL f = 1.02 + 3VT02 
= 4.05 


y> 


LCL c = 1.02 - 3VL02 

= - 2.01 


Debido a que el numero de empleados quienes no se presentan no puede ser un valor negativo, el 
LSC c se vuelve 0. La ocurrencia de los dias que tienen mas de 4 empleados ausentes indica que el 
sistema esta fuera de control. La carta c que se presenta a continuation resume los resultados de 
la prueba. 


o 

U 



i 1 r 

0 10 20 


LSC = 4.055 

MU = 1.022 
LIC - 0.000 


Numero de la muestra 


Interpretation 

En 13 de los 20 dias el numero de empleados ausentes era excesivo. Debe tomarse alguna medida. 


Ejercicios de la seccion 


5. Un fabricante toma 16 muestras de tamano 25 cada una y descubre que el numero de defectos es 5, 8, 9, 6, 5, 
4, 7, 5, 8, 2, 5 ,8, 9, 8, 7 y 5. Construya la carta p y haga los comentarios pertinentes sobre si el proceso de 
production estd fuera de control o no. 

6. MedTec produce aspirina y otras medicinas no registradas. Los requisitos de embotellado de la compama 
certifican que debe haber en cada botella entre 98 y 104 tabletas de aspirina. Se seleccionan doce muestras de 
200 botellas. El numero de botellas en cada muestra que no cumpla con las especificaciones de produccidn 
aparece a continuacidn. <?E1 proceso de embotellado de MedTec esta bajo control? 

El numero de botellas en cada muestra que no contiene el numero apropiado de pfldoras es: 

35, 36, 21, 10, 49, 52, 36, 36, 25, 24, 26, 15 
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7. Las proporciones muestrales de los telefonos celulares producidos por Com World que no cumplen con las 
reglamentaciones del gobiemo fueron en porcentajes, 44, 24, 30, 40, 38, 36, 26, 34, 30, 18, 24, 34, y 36. Cada 
muestra contenia 50 telefonos celulares. Haga e interprete la carta de control apropiada. ^Deberia Com World 
tomar medidas para colocar su proceso de produccion nuevamente bajo control? 

8. Moroccan Export en Casablanca selecciona 25 alfombras persas y descubre cierto numero de defectos por 
alfombra que aparecen a continuation. Realice la carta de control apropiada y haga los comentarios. 


Numero de defectos por alfombra 

2 

6 

3 

5 

8 

10 

3 

6 

6 

4 

5 

8 

6 

9 

4 

5 

2 

5 

6 

6 

6 

5 

9 

4 

5 


9. Green Leaf Nurseries vende arboles en las areas suburbanas donde les gusta barrer las hojas de sus cespedes 
cada otono. Despues de aplicar un tratamiento quimico para matar los parasitos, Green Leaf selecciona 20 
arboles y descubre el siguiente numero de insectos y otros bichos indeseables en cada arbol. Con base en la 
carta de control apropiada ^el proceso de rociado esta fuera de control? Haga los comentarios. 


Numero de parasitos por arbol 

23 

10 

9 

5 

8 

9 

25 

14 

10 

9 

6 

8 

9 

15 

20 

6 

5 

8 

6 

12 



10 . Ole Town Press publica un periddico pequeno cada semana en el area rural de Maine. El editor del periddico, 
Kent Clark, esta preocupado sobre lo que el teme es un numero creciente de errores tipogr&ficos. El Sr. Clark 
selecciona aleatoriamente 15 periodicos de los ultimos meses y descubre que el numero de “errores tipogrdficos” 
del periodico es: 


2 6 3 5 9 

1 0 5 6 8 

3 2 4 5 6 

^,E1 Sr. Clark tiene que preocuparse de que el proceso de impresion estd fuera de control? 


1 5.6 Interpretation de las cartas de control 

^Como pueden utilizarse las cartas de control para vigilar un proceso? ^Cdmo se puede decir si un sistema no 
cumple con las especificaciones de produccidn? ^La ocuirencia de solo uno o dos puntos fuera del limite superior 
o inferior sugiere que el proceso esta fuera de control? Deben considerarse varios factores al responder estas 
preguntas: 

La primera y la mas basica consideracion al leer una carta de control es si alguno de los puntos de datos cae 
fuera de los limites superior o inferior. Si incluso un solo punto cae fuera de los lfmites, existe evidencia estadfstica 
de que el proceso esta fuera de control. Sin embargo, esto no es necesariamente motivo de alarma. Esta ocurrencia 
puede darse sencillamente por la variacidn aleatoria. Deberia reunirse tanta information como se pueda sobre la 
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posible causa o causas de esta anomalia, y debe tomarse una determination sobre si existe en realidad un 
problema en el que pueda identificarse una variation de causa asignable. 

Ademas, incluso si todos los puntos estan dentro de los limites de control, la detection de ciertos patrones 
puede senalar un problema serio. Si por ejemplo, un gran numero de puntos estan solo a un lado de la linea central, 
el analista deberfa considerar la causa de tal configuration. Si el agrupamiento a un lado en particular de la recta 
central parece haber ocurrido abruptamente, la causa puede asignarse a un cambio subito en el uso de la materia 
prima o a la introduction de un nuevo sistema de capacitacion para los empleados que ingresan. Si el agrupamiento 
parece estar ocurriendo gradualmente, poniendo con el tiempo en evidencia una tendencia, esto puede indicar 
que la maquinaria utilizada en el proceso de production se esta desgastando continuamente y no esta funcionando 
conforme a las especificaciones. Si puede identificarse una causa asignable, se puede tomar una medida correctiva. 
En general, incluso si todos los puntos estan dentro de los limites de control, de todas maneras deberfa existir una 
fluctuation o variation por encima y por debajo de la linea central. 

Se tiene en mente que los limites de control se establecen a tres desviaciones estandar por encima y por debajo 
de la linea central. De acuerdo con la regia empirica, 99.7% de todas las observations deberfan caer dentro de 
estos limites. Por tanto, menos del 0.5% deberfa caer fuera del LSC y del LIC por pura probabilidad. Si el sistema 
esta bajo control, muy pocos puntos, si los hay, deberfan caer fuera de los limites establecidos. 

Ademas, la regia empirica senala que 95.5% de todas las observations deberfan caer dentro de dos desviaciones 
estandar de la linea central. Es decir, 95.5% de los puntos de datos deberfan caer dentro de los primeros dos tercios 
del area que esta alrededor de la linea central. Solo alrededor del 4.5% deberfan desviarse de la linea central en mas 
de dos desviaciones estandar. Por tanto, incluso si todos los puntos de datos estan dentro de los limites de 
control de tres desviaciones, pero un numero excesivo esta a mas de dos desviaciones estandar de la linea central, 
deberfa tomarse alguna medida para explicar su gran distancia de acuerdo con lo que establece la regia empirica. 

Esto se muestra en la figura 15.9. El LSC y el LIC estan dentro de 3a de la recta central. Esta area deberfa 
contener el 99.7% de los datos. Los primeros dos tercios de dicha area que esta por encima y por debajo de la linea 
central esta a 2 a de la linea central y deberfa comprender el 95.5% de los puntos de datos. Por ejemplo, en la figura 
15.9 aunque ninguno de los puntos caen por fuera de los limites de control, puede todavia existir un problema, ya 
que muchos puntos estan en el area que va mas alia de las dos desviaciones estandar de la linea central. 


Figura 15.9 

Carta de control 
que comprueba 
la falta 

de conformidad 


3 a 


3a 



LSC 


LIC 
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1 5.7 Muestreo de aceptacion 

Con frecuencia se deben tomar decisiones respecto a la aceptabilidad de todo un lote o envfo de productos. Una 
empresa puede comprar materia prima de su proveedor sin total conocimiento de la calidad de tales materiales. 
Entonces debe probarse el envfo para determinar si los materiales cumplen con ciertas especificaciones mfnimas. 
Rara vez una firma analiza cada artfculo de un envfo. Tal proceso demandarfa mucho tiempo y serfa demasiado 
costoso. Mas bien, se selecciona una muestra para determinar si todo el envfo debe aceptarse o regresarse al 
proveedor. 

Durante la produccion, una empresa manufacturera con frecuencia inspecciona varias unidades no terminadas 
para determinar si la produccion debe continuar o no, o si las unidades semiterminadas deberfan desecharse y 
revisarse los procesos para determinar la causa de los defectos excesivos. Esta decision tambien implica el uso de 
muestras para decidir si se estan cumpliendo o no unos estandares mfnimos. Esta practica se denomina muestreo 
de aceptacion. 


Muestreo de aceptacion Una muestra de un envio o lote de produccion se analiza 
para determinar si cumple con ciertas especificaciones minimas de calidad y por tanto 
es aceptable. 


El muestreo de aceptacion es una parte importante e integral de las medidas de control de calidad. Las 
decisiones respecto a la aceptabilidad de los materiales tienen un peso importante en los ingresos de la firma y en 
la estructura de costos. 

Asegurarse de que una parte se ajusta a los estandares de produccion es crucial para todo el proceso de 
fabrication. Si la empresa fabricante produce la pieza o la obtiene de un proveedor, deben cumplirse los estandares 
de produccion especfficos. Si un fabricante de sistemas de discos compactos utiliza una pieza que es demasiado 
pequena, todo el sistema puede funcionar inadecuadamente. Si una companfa de ensamble de aeronaves conffa 
en un metal que es demasiado pesado o que no puede soportar esfuerzos mfnimos, es probable que esto acarree 
serias consecuencias. Obviamente, las decisiones de control de calidad respecto a las especificaciones de 
produccion son crfticas. 

Se considera una empresa que hace telefonos celulares. Obtiene una pieza importante para cada telefono de 
un proveedor en Chicago. Las partes se envfan en lotes de varios cientos de unidades. La empresa no puede 
probar cada pieza recibida, de manera que es necesario un muestreo de aceptacion. La empresa esta dispuesta a 
aceptar un maximo de 5% de piezas defectuosas en cada envio. Este numero se denomina nivel de calidad 
aceptable (NCA). La empresa tambien limita al 1 % tales envios que cumplen con el NCA, pero que son rechazados 
equivocamente. Esto tiene el efecto de restringir el numero de envios no defectuosos que se descartan. 

En la practica comun, las decisiones respecto a tales porcentajes se determinan con mas frecuencia con base 
en la polftica de la compama, con frecuencia junto con el proveedor. Si se desea un metodo menos dispendioso 
para llegar a los porcentajes apropiados, puede usarse el Military Standard Sampling Procedures and Tables for 
Inspection by Atributtes (MIL-STD-105D) (Procedimientos Militares de muestreo estandar y tablas de inspection 
por atributos). Estas tablas especifican el tamario de la muestra adecuado y el numero de defectos necesarios para 
rechazar el envio. 

Debido a que el muestreo esta involucrado, es posible cometer un error al decidir si aceptar o rechazar un 
envio. Un envio que cumple con las especificaciones minimas puede rechazarse. Este es un error tipo I, y se 
denomina riesgo del productor, porque los productores son los que corren el riesgo de que les devuelvan un 
envio. 
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Riesgo del productor La probabilidad de que el error de muestreo ocasione que el 
comprador rechace equivocamente un envio y lo regrese al vendedor se denomina 
riesgo del productor. Este es un error tipo I. 


Un error tipo II ocurre cuando se acepta un envfo malo. Aceptar un envfo malo se llama riesgo del consumidor, 
debido a que el comprador sin saberlo tendra un envfo con un numero excesivo de defectos. 


Riesgo del consumidor La probabilidad de que el error de muestreo conlleve al 
comprador a retener un envio que contiene un numero desproporcionado de defectos. 
Este es un error tipo II. 


Un error tipo I se llama nivel a, y la probabilidad de un error tipo II se llama (3. 

Considerando nuevamente la empresa de telefonfa celular, se establecio que un envfo que contiene mas del 
5% de defectos debena rechazarse (NCA = 5%), y solo el 1% de los envfos buenos se regresarfan equivocamente 
(a = 1%). Este 1% es el valor del riesgo del productor. Su proposito es proteger los proveedores de la empresa del 
rechazo no garantizado de un lote de productos o envfo. 

Del analisis anterior de las distribuciones de probabilidad se tiene que una distribucion hipergeometrica 
podrfa utilizarse para determinar la probabilidad de que un cierto numero de defectos se encuentren en un envfo. 
En la practica, la distribucion binomial, debido a su simplicidad, es utilizada con mas frecuencia para proporcionar 
una aproximacion exacta. 

Se asume que de los varios cientos de piezas recibidas por la empresa de telefonfa celular, se toma una muestra 
de n = 50. Dado que la empresa acepta un NCA del 5%, n se fija en 0.05. Entonces es necesario determinar que 
numero de defectos garantiza que no se rechace mas del 1% de envfos buenos. Es decir, ^que numero de defectos 
asegurara que por lo menos 99% de los envfos buenos que contienen 95% (1.00 - NCA) de no defectos se 
acepten? Este numero de defectuosos que determina si aceptar el envfo o no se llama numero de aceptacion. 


Numero de aceptacion Es el numero maximo de defectuosos de una muestra que 
pueden ocurrir sin producir el rechazo de un envio. Garantiza que se mantenga el NCA 
sin rechazar mas del porcentaje prescrito de los envfos buenos. 


El maximo numero de defectos, C puede encontrarse en la extension de la tabla C (apendice III). Para n = 50, 
baje por la columna encabezada con n = 0.05 hasta que encuentre el primer valor que excede de ( 1 .00 - el riesgo del 
productor), en este caso 1 .00 - 0.01 = 0.99. Este valor es 0.9968, el cual esta relacionado con C= 7. La probabilidad 
mas cercana que no supera el 1 % de defectos es 1 .00 - 0.9968 = 0.0032 < 0.01 . Si hay mas de C = 7 defectos en la 
muestra de n = 50, todo el lote deberfa regresarse. 


Ejemplo 15.4 Dilema de Claude y Carol 

Claude Vaughan es director de control de calidad de la planta embotelladora de PepsiCo en Cincinnati. 
Los datos sobre los niveles de production demuestran que un numero exagerado de botellas estan 
bajas de contenido. Temeroso de que el envfo de botellas pudiera espantar a los clientes, Claude 
propone un plan de muestreo de aceptacion para minimizar los envfos con bajo contenido sin hacer 
que se descarten demasiadas botellas que estan con el nivel de llenado adecuado. 
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El acuerda con el supervisor de produccion, Carol Henning, que pueden enviar maximo un 1% de 
botellas bajas de contenido. Esto representa el nivel aceptable de defectos, de manera que NCA = 
1%. Carol insiste en que no mas del 10% de los lotes de produccion aceptable deban rechazarse. Es 
decir, el riesgo del productor debena limitarse al 10%. Si las muestras de 100 se toman de un lote de 
produccion ^Cual es el numero de aceptacion de botellas bajas en contenido que Claude y Carol 
pueden tolerar antes de que se rechace todo el lote? 


Solucion 

Utilizando la extension de la tabla binomial acumulada, se fija n igual a NCA de 1%. Claude y Carol 
deben encontrar el numero de botellas con bajo nivel de contenido que no terminen en el rechazo 
de mas del 10% de los lotes de produccion del producto. Elios seleccionan una muestra de 100 
botellas del lote mas reciente. Dado que n = 0.01, el numero de botellas con bajo nivel de contenido 
que garandza que no se rechace mas del 10% de los lotes buenos es dicho valor de C que tenga una 
probabilidad que exceda de (1 .00 - riesgo del productor), o 1 .00 - 0. 10 = 0.90. En la tabla, bajo n = 
1 00, se encuentra la columna encabezada con n = 0.01 . Se baja por la columna hasta que se encuentre 
una probabilidad superior a 0.90. Este valor es 0.9206, el cual tiene el numero de aceptacion C= 2. 

Interpretation 

Al rechazar todos los lotes de produccion de los cuales se tomaron las muestras de n = 100 que 
contienen mas de dos botellas con bajo contenido, Claude y Carol aseguraran que a largo plazo los 
lotes de produccion no contendran mas del 1% de botellas con nivel bajo de contenido y que los 
lotes que tengan menos de 1% de botellas con bajo contenido se rechazaran no mas del 10% del 
tiempo. 


A. Diferentes planes de muestreo 

El muestreo de aceptacion asume que solo se tome una muestra. Esto logicamente se refiere a un plan de una sola 
muestra. Sin embargo, se pueden tomar dos o mas muestras. Dichos planes se denominan planes de muestreo 

multiple o secuencial. 

Un plan de muestreo doble involucra la seleccion de una muestra primaria. Con base en los resultados de esta 
primera muestra, el plan luego requiere una de tres acciones: 1) el lote puede rechazarse; 2) el lote puede aceptarse; 
o 3) se puede tomar una segunda muestra. Se especifican dos valores de C, en donde C { es el numero de 
aceptacion de la primera muestra, y C 2 es el numero de aceptacion para ambas muestras. 

Para ilustrar, se asume que un plan de muestreo doble estipula n } = 100, n 2 = 100, C, = 3, C 2 = 8. Se selecciona 
una muestra preliminar de 100. Si se encuentran tres o menos defectos, se acepta el lote. Si se encuentran 3 + 8 = 
1 1 o mas, entonces se rechaza el lote. Si la primera muestra contiene de 4 a 10 defectos, se toma una segunda 
muestra de n 2 = 100. Si el total de defectos en ambas muestras supera los 1 1 se rechaza el lote. 

Los planes secuenciales tienden a ser mas eficientes que los planes de una sola muestra debido a que se 
necesitan menos observaciones para garantizar el mismo grado de precision. Los planes secuenciales se utilizan 
con frecuencia cuando la prueba requiere de la destruction de cada unidad. 

A medida que se agudiza la competencia en el mercado mundial, una empresa debe asegurarse que su producto 
o servicio cumpla con los estandares minimos si espera permanecer en el mercado. Por tanto las medidas de 
control de calidad son vitales. 


B. Curvas caracteristicas de operation 

Quienes tienen que ver con planes de control de calidad frecuentemente consideran conveniente crear curvas de 
operation (CO). Tales curvas despliegan la probabilidad de aceptacion bajo una diversidad de condiciones. 
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Especfficamente, una curva CO puede permitir al especialista en control de calidad evaluar, dados valores diferentes 
para la proportion de defectos it, 1) la probabilidad de aceptar un lote dado: el tamano de la muestra n, 2) el numero 
maximo de defectos permisibles, C . 

Para ilustrarlo, se puede disenar un plan de muestreo en el cual se seleccione de forma rutinaria n = 10 unidades 
de cada envfo de forma aleatoria. Se determina que si C = 3 o menos unidades, todo el lote se aceptara. Bajo este 
esquema, es posible calcular la probabilidad de aceptacion para los valores diferentes de tt. Por ejemplo, si 
tfpicamente it = 5% de las unidades son defectuosas, <cual es la probabilidad de que un lote dado se acepte? Esta 
pregunta puede responderse con el uso de la distribution binomial acumulada. De la tabla binomial acumulada, se 
puede observar que la probabilidad de aceptacion = P (C < 3 | n = 10, n = 0.5) = 0.9990. Si por otro lado, la 
proportion de defectos en el pasado ha resultado 10%, la probabilidad de aceptacion sera P (C < 3 | n = 10, n = 
0.10) = 0.9872. Logicamente se nota que entre mas alto sea el valor para it menos probable es que se acepte el 
envfo. Si se seleccionan otros valores posibles para it, la relation entre tt y la probabilidad de aceptacion puede 
determinarse y representarse con una curva CO como se muestra en la figura 15.10. 


Figura 15.10 

Curva caracteristica 
de operacion para 
n = 10, C = 3 



La forma de la CO se determina mediante el valor tt, pero otros factores tambien la afectan. Si por ejemplo se 
incrementa C, la probabilidad de aceptacion sube para todo valor de tt. Por tanto toda la curva CO cambiarfa hacia 
arriba. 


Si el tamano de la muestra n se incrementara, toda la curva irfa hacia abajo. Se tiene P (C < 3 I n = 10, it = 0. 10) 
= 0.9872 y P(C< 3\n = 15, n - 0.10) = 0.9444 La probabilidad de que una muestra mas grande termine en 
aceptacion, dados los valores para C y it es mas pequena que la de una muestra pequena con valores 
correspondientes para C y tt. De esta forma la curva CO puede utilizarse para disenar un plan de control de calidad 
con necesidades especfficas de cualquier operacion en el negocio. 


Problemas resueltos 

1. Hallando los incumplimientos en los pagos Business Week describio el problema que un importante banco en 
Chicago tenia con los incumplimientos en los creditos. Se supone que se seleccionaron muestras de tamano 
5 para siete funcionarios y se tabularon los resultados. Desarrolle un X y una R para el banco. 


Monto de credito (en US$1,000's) 


Funcionario 

1 

2 

3 

4 

5 

X 

R 

1 

14.2 

9.2 

7.1 

6.8 

6.0 

8.7 

8.2 

2 

45.5 

65.5 

45.2 

55.2 

55.1 

53.3 

20.3 

3 

23.4 

31.2 

36.3 

31.5 

32.6 

31.0 

12.9 

4 

32.3 

31.2 

29.1 

27.8 

28.1 

29.7 

4.5 


(Continua) 
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Monto de credito (en US$1 f OOO's) 


Funcionario 

1 

2 

3 

4 

5 

X 

R 

5 

56.7 

65.3 

45.2 

55.5 

58.2 

56.2 

20.1 

6 

89.7 

90.2 

84.2 

85.5 

89.2 

87.8 

6.0 

7 

K- 54.6 

ff = 18.1 

112.0 

99.2 

115.3 

98.5 

153.2 

115.6 

382.3 

54.7 

126.7 


Solucion 


LSC* = f 4- AJR. 

= 54.6 + (0.577X18.1) 
= 65.04 

UC X = f 4^ 

= 44.16 



LSC = 65.04 


X = 54.6 
LIC = 44.16 


Muestras 


Existe una inconsistencia aparente en el tamano de los creditos otorgados por siete funcionarios bancarios. 
Quiza deberia hacerse algun esfuerzo por encontrar una explication para la disparidad en las practicas de los 
funcionarios. Los funcionarios primero, tercero y cuarto estan concediendo creditos pequenos de forma inusual, 
y el ultimo funcionario parece otorgar creditos excesivamente grandes. 

Se encuentra que la carta R es: 


LSC/? = Dfi 

= (2.115X18.1) 
= 38.3 
UC R = D,R 
= (0X18.1) 

= 0 
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Muestras 


Solo un funcionario parece estar violando los lfmites de control para el rango. De nuevo, el patron del 
septimo funcionario sobresale del resto, sugiriendo que sus practicas deberfan revisarse. 

2. Comparacion de funcionarios A1 considerar la disparidad en el desempeno de los funcionarios, puede ser 
razonable utilizar una carta p para comparar cada funcionario. Se seleccionan muestras de 1 0 creditos otorgados 
por los funcionarios, y se registra la proporcion de incumplimientos en el credito para cada uno: 


Funcionario 

Numero de defectos 
(incumplimientos), c 

Proporcion 
de defectos, p 

1 

4 

0.4 

2 

3 

0.3 

3 

3 

0.3 

4 

2 

0.2 

5 

0 

0.0 

6 

3 

0.3 

7 

8 

0.8 


~23 


23 

0.f.a33 




Solucion 

LSCp = p + 3 

= 0.33 + 3(0.056) 
= 0.498 

UC„ = p~ 3 

= 0.162 




Se tiene que 0.498 y 0. 1 62 son los lfmites preliminares para p y se muestran en la carta p. El ultimo funcionario 
se diferencia de nuevo del resto. Su tasa de incumplimiento es excesiva. Ademas, el hecho de que el quinto 
funcionario no tuviera incumplimientos tambien puede indicar un punto problema. Quizas el o ella esta siendo 
demasiado conservador al otorgar los creditos, y se le debe exigir un mayor grado de agresividad. 
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A1 eliminar las muestras quinta y sexta, se puede determinar los lfmites finales. Estos son LSC = 0.495 y 
LIC =0.105. 

p 



Muestras 


Un analisis adicional de los procesos de erddito puede implicar el uso de las cartas c para controlar el 
numero de errores (defectos) cometidos en cada solicitud de credito (unidad). En este esfuerzo, n = 12 
creditos se seleccionan aleatoriamente, y se registra el numero de violaciones de la politica bancaria para cada 
solicitud de credito. 


Credito 

Violaciones (defectos), c 

Credito 

Violaciones (defectos), c 

1 

3 

7 

2 

2 

4 

8 

0 

3 

2 

9 

3 

4 

3 

10 

4 

5 

10 

11 

2 

6 

1 

12 

3 




37 


En 37 casos la politica bancaria no se cumplid al extender los 12 creditos. Por tanto: 



s e r = VJm 

c = 1.75 

Entonces, 


LSC = c + 3s c 

c 1 

= 8.33 

UC = c - 3i- 

C c 

= -2. 1 7, y se toma como 0 


S61o el quinto erddito de la muestra sugiere un problema. La gerencia deberfa determinar quidn aprobd el 
credito: medida que puede tomarse para reducir el numero de incumplimientos en el pago de los erdditos. 
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LSC = 8.33 



c = 3.08 


1 2 3 4 5 6 7 8 9 10 11 12 


LIC = 0 


3. Estas cucharadas, o esta despedido Crisp-O Raisin Bran, un fabricante importante de cereales, promete tres 
cucharadas de uvas pasas en cada caja. Una caja con menos cucharadas es considerada como defectuosa. 
Un cliente de Crisp-O aceptara un maximo del 1 % de cajas defectuosas. Crisp-O acepta esta norma de calidad, 
pero insiste en limitar el riesgo del productor al 5%. No mas del 5% de los envios, que cumplan la restriccion 
de contener por lo menos el 99% de cajas con 3 cucharadas deben ser rechazadas. Por ende, al menos 95% de 
los envios buenos se deben aceptar. De la muestra de 100 cajas seleccionadas de un envio grande, ^cual es 
el numero de aceptacion de defectos que puede terminar en el rechazo de dicho envio? 

Debido a que el cliente no aceptara mas del 1 % de defectos, el NCA se fija en 1 %. De la extension de la tabla 
binomial, se debe encontrar un numero C que no produzca el rechazo de mas del 5% de los envios buenos. 
(Un envio bueno es aquel que contiene por lo menos el 99% de las cajas con tres cucharadas de uvas pasas). 
El valor n se fija en 1%. Bajando por la columna encabezada con n = 0.01 y con n = 100, se encuentra que el 
primer numero excede de ( 1 .00 - riesgo del productor), o 1 .00 - 0.05 = 0.95, es 0.98 1 6, el cual esta relacionado 
con C = 3. Asf, si se toma una muestra de n = 100 de un envio grande, y mas de 3 cajas de las 100 analizadas 
contienen menos de tres cucharadas de uvas pasas, todo el envio deberia devolverse a Crisp-O. 


Lista de formulas 


[15.3] 


[15.4] 


[15.7] 


LSC* = X + A 2 R 


UCx ~ X — A 2 R 


LSC/? = D 4 R 


El lfmite superior de control es el 
valor maximo que una media 
muestral puede asumir sin indicar 
que el proceso esta fuera de 
control. 

El lfmite inferior de control es el 
valor mfnimo que una media 
muestral puede tomar sin indicar 
que el proceso esta fuera de 
control. 

El lfmite superior de control es el 
maximo valor que un rango 
muestral puede tomar sin indicar 
que el proceso esta fuera de 
control. 
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[15.8] 

uc R = d 3 r 

El limite inferior de control es el 
minimo valor que un rango muestral 
puede tomar sin indicar que el 
proceso esta fuera de control. 

[15.10] 

IpO-p) 

V „ 

Desviacion estandar del numero de 
defectos. 

[15.13] 

LSC„-p + 3y/ J n 1 

El limite superior del control es el 
valor maximo que una proporcion 
muestral puede tomar sin indicar 
que el proceso esta fuera de control 

[15.14] 

UC P -P 3 yj n - 

El limite inferior de control es el 
minimo valor que una proporcion 
muestral puede tomar sin indicar 
que el proceso esta fuera de 
control. 

[15.15] 

s . = Vc 

Desviacion estandar del numero de 
defectos en la carta c. 

[15.16] 

LSC r = c + 3 s z . 

El limite superior de control es el 
maximo numero de defectos que 
pueden ocurrir sin indicar que el 
proceso esta fuera de control. 

[15.17] 

LJC t = c - 3 s d 

El limite inferior de control es el 
minimo numero de defectos que 
pueden ocurrir sin indicar que el 
proceso esta fuera de control. 


Ejercicios del capi'tulo 

11 . En su empresa, el director de su division pasa por su escritorio y se da cuenta que usted esta trabajando con 
algo llamado carta de control. Debido a que el consiguio el trabajo por ser el yemo del jefe, y no sabe nada de 
cartas de control o de control de calidad, el desea que usted le describa lo que esta haciendo y por que. Anote 
en sus propias palabras el proposito y la funcion de las cartas X , R , c , y p. 

12 . Defina el numero de aceptacion y el nivel de calidad aceptable tal y como se utiliza en el muestreo de 
aceptacidn. Si NCA es 5% y el riesgo del productor es 1%, £cdmo describirfa usted el numero de aceptacion 
en tdrminos de estos dos porcentajes? 

13 . Acme Salt Mine, en donde usted trabaja como principiante, le ha pedido que registre el numero de millas que 
el personal de ventas conduce al hacer las visitas de ventas. Utilizando estos datos de muestras durante 
cinco dias consecutivos, haga las cartas X y R. ^Parece que el sistema esta fuera de control? 
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Millas conducidas 


Muestra 


1 

112 

132 

145 

117 

125 

189 

2 

214 

252 

274 

189 

236 

203 

3 

198 

205 

185 

214 

236 

199 

4 

236 

250 

245 

210 

210 

259 

5 

109 

111 

125 

132 

145 

152 


14 . Durante un perfodo de varios dfas, Tolbart Manufacturing recolecta siete muestras de tamano 5 sobre el peso 
de un nuevo producto. Haga una carta R para determinar si el proceso de produccion esta bajo control. Los 
pesos en onzas aparecen a continuacion: 


Observaciones 


Muestras 


1 

42 

48 

28 

43 

52 

2 

52 

57 

24 

41 

21 

3 

48 

65 

54 

35 

45 

4 

59 

35 

53 

63 

56 

5 

68 

65 

62 

35 

56 

6 

57 

54 

42 

32 

35 

7 

51 

51 

51 

34 ■ 

35 


15 . ^Que revela una carta X sobre el proceso del problema anterior? 

16 . Un productor de motos para nieves toma muestras diarias de produccion tomando 10 muestras, cada una de 
la produccion de cinco dfas. Los datos aparecen a continuacion. Realice la carta R y saque una conclusion 
respecto al control del proceso. 


Muestras 


1 5 

2 2 

3 6 

4 4 

5 2 

6 5 

7 6 

8 8 

9 9 

10 5 


Observaciones 


3 
6 
9 
8 
5 
7 

4 

5 
9 

6 


5 

1 

5 
8 
9 

6 
5 
4 

7 

8 


5 

3 

6 
5 
8 
9 
5 

4 

7 

8 


5 

1 

2 

12 

10 

11 

16 

8 

9 

8 
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17. Utilizando los datos del ejercicio 16, haga e interprete una carta X. 

18. Una nueva tecnologia registra las longitudes de una cuerda medida en pies. Realice una carta R y saque una 
conclusion respecto al beneficio de este nuevo metodo de production. 


Observaciones 


Muestra 


1 

12.5 

14.8 

21.5 

15.8 

23.6 

12.5 

2 

13.6 

15.9 

23.6 

14.6 

25.4 

21.5 

3 

15.8 

26.0 

15.6 

21.5 

21.5 

14.2 

4 

15.6 

8.0 

25.7 

23.5 

19.2 

15.6 

5 

12.5 

26.0 

32.8 

15.4 

19.7 

15.5 

6 

14.8 

15.8 

32.5 

18.2 

18.2 

12.5 

7 

22.5 

16.9 

12.8 

14.7 

14.5 

18.2 

8 

32.6 

14.5 

14.9 

12.0 

15.6 

14.5 

9 

15.5 

14.2 

15.8 

14.5 

21.5 

12.2 


19. Utilizando los datos del ejercicio 18, haga e interprete una carta X. 

20. Veinte muestras de tamano 7 para los pesos (en onzas) del contenido de las latas de cola arrojaron los 
resultados siguientes. ^El productor debe buscar las causas asignables con base en una carta R o en una 
carta XI 


Muestra 

Media 

Rango 

Muestra 

Media 

Rango 

1 

27 

6 

11 

32 

7 

2 

32 

8 

12 

45 

9 

3 

21 

4 

13 

34 

5 

4 

24 

8 

14 

23 

7 

5 

43 

6 

15 

32 

8 

6 

31 

7 

16 

21 

4 

7 

23 

5 

17 

34 

4 

8 

12 

6 

18 

21 

7 

9 

21 

5 

19 

27 

5 

10 

32 

9 

20 

34 

6 


21. Los resultados de diez muestras de tamano 6 cada una para la longitud (en pulgadas) de cable electrico 
aparecen a continuation. ^A1 hacer una carta R y una carta X, el sistema esta fuera de control?: 
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Muestra 

Media 

Rango 

Muestra 

Media 

Rango 

1 

20 

7 

6 

34 

4 

2 

18 

9 

7 

21 

3 

3 

17 

8 

8 

12 

2 

4 

23 

2 

9 

18 

6 

5 

19 

5 

10 

13 

5 


22 . AllRight Insurance Company de Buffalo, Nueva York, recolecta cinco muestras de tamano 12 cada una sobre 
las reclamaciones contra ellos por danos en los autos. Las medias y los rangos se proporcionan en la 
siguiente tabla. Haga las cartas X y R, y realice sus comentarios. 


Muestra 

Media 

Rango 

Ene 

US$812 

US$54 

Feb 

234 

23 

Mar 

321 

27 

Abr 

250 

29 

May 

276 

20 


23 . En el ejercicio 22, ^una tormenta de nieve en el mes de enero que significarfa? 

24 . Una gran tienda de repuestos para autos en Little Rock se rehusa a aceptar un envio de tapas para el 
distribuidor si mas del 5% estan defectuosas. Los gerentes de la tienda aceptan, para proteger sus proveedores, 
que en los envios muestreados no regresaran mas del 20% de todos los envios que cumplan el requisito del 
5%. Si se toman muestras de 50, ^cual es el numero de aceptacidn? 

25 . Para el ejercicio 24, <?,cual es el numero de aceptacion si se toman muestras de 20? 

26 . En el ejercicio 24, si el porcentaje real de tapas defectuosas es del 10%, ^cudl es la probabilidad de que sea 
aceptado un envio si se toma una muestra de 50 tapas? 

27. Del ejercicio 24 y 26, si el porcentaje real de defectos es 1 %, ^cual es la probabilidad de que se acepte el envio? 
Haga comentarios sobre la diferencia en sus respuestas en este problema y en el ejercicio 26. 

28 . Kmart vende unidades detectoras de radar utilizadas por los motoristas. La polftica de la compama es aceptar 
un maximo de 5% de unidades defectuosas. S61o el 10% de los envios que contengan menos del 5% de 
defectos seran devueltos al proveedor. ^Cudl es el numero mdximo de detectores defectuosos que pueden 
ocurrir en una muestra de 50? 

29 . Si el riesgo del productor se reduce al 1 % en el ejercicio 28, ^cudl es el numero de aceptacidn? Haga comentarios 
sobre la diferencia en su respuesta con el ejercicio 28. 

30 . Un recien graduado del programa de maestna en Administracidn de negocios en una universidad privada 
esta haciendo por ahora negocios independientes. El desea probar su metodo de produccidn tomandolO 
muestras de tamano 8 cada una. Encuentra que A = 42 y R= 17. Determine sus limites de control tanto para las 
cartas R como para las cartas X. 

31 . Para probar adicionalmente su producto, el recien graduado del ejercicio 30 toma 15 muestras de tamano 100, 
y encuentra que el numero de defectos en cada muestra es: 
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Muestra 

Defectos 

Muestra 

Defectos 

1 

4 

8 

8 

2 

8 

9 

7 

3 

8 

10 

9 

4 

3 

11 

3 

5 

8 

12 

9 

6 

5 

13 

6 

7 

6 

14 

8 



15 

7 


Si la carta p revela que su proceso de production esta bajo control, planea “globalizar” su producto. ^Deberia 
hacerlo? 

32 . TCB Y Yogurt comprobo la estabilidad del funcionamiento de su franquicia tomando muestras de 25 cada una 
en seis estados. Los numeros de franquicias que fallaron fueron 4, 7, 2, 6, 8 y 12. Haga una carta p para ayudar 
a TCB Y a vigilar sus puntos de venta. 

33 . La Bradley University utiliza dos paquetes de procesador de texto: Professional Write y WordPerfect. Para 
comparar sus meritos relativos, se tomaron muestras de tamano 18 del tiempo que le tomo al personal de la 
facultad dominar cada paquete. Los resultados se muestran a continuation. Prepare las cartas X y R para 
utilizarlas para evaluar cada paquete. ^Cuales son sus conclusiones? 


Professional Write V. 2.0 

Muestra 

Media (horas) 

Rango (horas) 

1 

3.2 

1.2 

2 

3.9 

0.9 

3 

3.9 

1.5 

4 

3.7 

1.5 

5 

3.6 

1.1 

6 

3.3 

1.9 

7 

2.5 

1.8 

8 

3.6 

1.7 


WordPerfect V. 5.1 

Muestra 

Media (horas) 

Rango (horas) 

1 

78.5 

10.2 

2 

79.5 

8.7 

3 

55.6 

6.8 

4 

78.6 

7.8 

5 

58.9 

11.3 

6 

72.8 

10.6 

7 

86.9 

12.3 


34 . En una revision continuada (ver ejercicio 33) de los paquetes de procesador de texto, el personal de la Bradley 
University tomo cuatro muestras (en realidad el numero de muestras fue mucho mayor) de 50 paginas, 
digitadas cada una con WordPerfect y encontro lo siguiente 
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10 paginas con un total de 12 errores 
12 paginas con un total de 18 errores 
8 paginas con un total de 15 errores 
17 paginas con un total de 13 errores 

Cuatro muestras de 50 paginas digitadas cada una con Professional Write revelaron lo siguiente: 

2 paginas con un total de 2 errores 

0 paginas con errores 

1 pagina con un total de 1 error 

3 paginas con un total de 3 errores 

Prepara una carta p y una carta c para estos datos. 

35. Up Your Cash Flow (Publicaciones Granville), escrito por Harvey Goldstein, CPT, observa varias hojas de 
calculo y la velocidad con la cual pueden pronosticar los presupuestos. Lilly Paper Products aplico algunos 
de los principios encontrados en el libro. Descubrieron que 10 muestras de tamano 15 del numero de dias 
que le tomo a las oficinas locales preparar sus presupuestos trimestrales produjo las siguientes medias y 
rangos: 


Muestra 

Media 

Rango 

1 

32.4 

23.4 

2 

68.7 

45.3 

3 

45.6 

18.6 

4 

67.6 

45.6 

5 

23.8 

18.3 


Muestra 

Media 

Rango 

6 

45.7 

34.6 

7 

56.7 

17.5 

8 

13.2 

12.2 

9 

34.5 

29.8 

10 

76.7 

67.9 


Relice las cartas X y las cartas R. iQue concluye? 

36. Nation's Business reporto que el libro de Harvey Mackay, Beware the Naked Man Who Offers You His Shirt 
(Morrow) (Tenga cuidado con el hombre desnudo que te ofrece su camisa) explica a los ejecutivos del 
negocio, entre otras cosas, como seleccionar un abogado. Una gran empresa legal escoge una muestra de 
tamano 30 cada mes, durante los ultimos 15 meses, del numero de casos legales que manejo. A continuation 
seregistraronloscasosquelafirmaperdio: 5,4, 12, 0, 19,21,4, 23,8, 12, 19, 12, 23,6yl0. Haga una cartap para 
determinar si el proceso esta fuera de control 

37. Kador, el cientifico mas malevolo del mundo, fabrica amuletos para exorcizar hechizos malignos. Para control 
de calidad Meldok, el asistente de Kador, selecciona 30 amuletos e inspecciona cada uno en busca de 
defectos. El propdsito de la inspection es determinar si un amuleto dado contiene demasiados defectos como 
para utilizarlo. El numero de defectos en cada amuleto aparece en las siguientes tablas. Disene la herramienta 
apropiada de control de calidad y determine si el proceso esta fuera de control. 
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Amuleto 

Numero 
de defectos 

Amuleto 

Numero 
de defectos 

Amuleto 

Numero 
de defectos 

1 

3 

11 

4 

21 

8 

2 

2 

12 

2 

22 

2 

3 

4 

13 

0 

23 

7 

4 

1 

14 

0 

24 

3 

5 

0 

15 

5 

25 

1 

6 

1 

16 

2 

26 

9 

7 

3 

17 

3 

27 

7 

8 

4 

18 

4 

28 

0 

9 

0 

19 

5 

29 

0 

10 

3 

20 

7 

30 

1 


38. Una empresa que prepara declaraciones de impuestos intenta revisar dos veces todos los formatos que 
diligencia. Sin embargo, en el perfodo de enero al 15 de abril, esto ha sido imposible. La politica de la firma es 
permitir maximo un 1 % de declaraciones con errores. Si se presumen mas errores, todo el lote debe hacerse de 
nuevo. Sin embargo, una empresa no desea hacer de nuevo un lote de declaraciones si menos del 1% 
contiene errores, si puede evitarse. Decide fijar un limite sobre calcular de nuevo un lote bueno al 5% de las 
veces. Se toma una muestra de 20 de un lote grande y re vela que cinco declaraciones contienen errores. 
^Deberia revisarse de nuevo todo el lote? 

39. Mother’s Best vende rosquillas al por menor. De un camion se toma una muestra de 100 rosquillas, y 8 se 
encuentran defectuosas. Si Mother’s Best esta dispuesta a aceptar un maximo del 10% de defectos, y sus 
proveedores desean restringir su riesgo al 20%, ^deberia devolverse este envio? 

40 . Yakov Smirnoff, un comediante ruso americano publica que Best Western tiene habitaciones economicas 
para los viajeros. Se promediaron los costos de alojamiento por noche durante 15 noches ( n = 15) en 20 
oportunidades (k = 20 muestras). La media de esas 20 medias muestrales fue de US$45. 1 2, con un rango medio 
de US$12.34. ^Cuales son los valores para las cartas Xy R1 

41 . Budget Rental, una empresa de alquiler de autos practica una politica en la cual cada carro se coloca en una 
lista de verificacion antes que se entregue a un cliente. Una valoracion reciente de 20 carros descubrio que los 
siguientes puntos de verificacion habian sido pasados por alto: 3, 5, 7, 2, 6, 8, 10, 4, 9, 12, 7, 3, 6, 13, 12, 4, 15, 
4, 5, y 9. <?,E1 sistema de la lista de verificacion esta bajo control? 

42 . Las licitaciones elaboradas por una empresa de construction para un trabajo se analizan para determinar si 
debe incrementarse el numero de licitaciones que la empresa gana sobre sus competidores. Se toman muestras 
de tamano 40, produciendo las medias y los rangos que aparecen aqui en miles de dolares. ^El proceso de 
licitacion esta fuera de control? 


Muestra 

Media 

Rango 

1 

7.5 

5.4 

2 

8.6 

4.5 

3 

4.5 

3.4 

4 

5.6 

2.5 

5 

8.9 

3.2 


43. Con la sospecha de que My Mother’s Catch, un bote pesquero del Mar de Bering, esta utilizando medios 
ilegales para aumentar su pesca diaria, la guardia costera de Estados Unidos tomo muestras de cinco 
cargamentos de los botes durante 6 dias durante el mes anterior. ^Las tacticas ilegales podrfan ser la causa 
asignable? 
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Bote 

Cargamento promedio (toneladas) 

Rango 

My Mother's Catch 

39.4 

12.2 

Neptune’s Spear 

18.6 

18.2 

Salty Dog 

19.6 

21.2 

Wind Ablow 

38.8 

22.5 

Deep 6 

21.2 

19.2 


44 . Fox Pictures distribuye muchas peliculas a sus teatros de todo el pais. Decide tomar muestras de lotes de una 
pelicula en particular para determinar si las copias fueron reproducidas sin imperfecciones. Si el proceso de 
muestreo sugiere que no mas del 5% de las copias tienen un defecto, todo el lote se distribuira a las empresas 
de cine. Los funcionarios desean rechazar los lotes buenos no mas del 10% de las veces. Si proyectan 20 
copias de una pelicula y encuentran que 7 tienen fallas, ^deberia destruirse todo el lote? 

45 . En las 20 peliculas que Fox proyecto en el ejercicio 44, descubren que el numero de fallas en las peliculas 
fueron: 6, 7, 2, 12, 19, 10, 2, 2, 22,21,0, 1, 19, 0, 15,3, 12, 21, 2y 5. ^Parece que el proceso de reproduction esta 
fuera de control? 

46 . Labor Inc., selecciona varias muestras de tamano de 50 empleados para quienes recientemente ha encontrado 
trabajo, y descubre que el numero en cada muestra que todavia tienen el mismo trabajo un ano mas tarde es 
10, 12,4, 17,2,21,34, 32,43, 12, 5, y 5. ^E1 sistema de colocation esta fuera de control? 

47 . Calcule los limites finales de control en el ejercicio 46. 

48 . La impresora laser IBM 4019 imprime en promedio casi 10 paginas por minuto. De las 1 ,200 paginas impresas, 
se seleccionan 100 aleatoriamente y se buscan errores. Doce paginas presentaron un promedio de 2.3 errores. 
Deberfan reimprimirse todas las 1 ,200 paginas si el NCA = 5% y el riesgo del productor se fija en 15%? 

49 . Determine los limites de control para una carta c en el ejercicio 48. 

50 . Las temperaturas en las cajas de refrigeracion se vigilan durante un perfodo de 10 dias, durante el cual la 
temperatura se registra todos los dias cada hora durante ocho horas. Las medias y rangos resultantes 
aparecen a continuacion. ^Parece que algo deberfa hacerse sobre el proceso de refrigeracion? 


Muestra 

Media (F) 

Rango 

Muestra 

Media (F) 

Rango 

1 

32 

29 

6 

23 

21 

2 

45 

21 

7 

57 

34 

3 

12 

45 

8 

13 

45 

4 

54 

34 

9 

31 

12 

5 

17 

24 

10 

47 

2 

Federal Express toma ocho muestras de tamano 25 para medir el numero de horas que le toma entregar los 
paquetes. Los resultados de dicho estudio se muestran a continuacion. ^Debe tomarse alguna action 
correctiva? 

Muestra 

Media 

Rango 

Muestra 

Media 

Rango 

1 

22.2 

3.2 

5 

24.6 

3.3 

2 

17.5 

3.4 

6 

23.3 

2.4 

3 

18.0 

2.9 

7 

21.5 

2.4 

4 

23.4 

2.5 

8 

19.8 

3.1 
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Ray Murdock, el nuevo CEO de Minot Industries, tal como 
se menciono en la seccidn Escenario, a comienzos de este 
capftulo, ha pedido mejorar los est&ndares de produccidn 
en Minot. Durante varios anos la compama ha producido 
cristaleria de varios tipos. Debido a la introduccion de 
tecnicas de produccidn m&s modemas, Minot ha tenido 
algunos “inconvenientes” que han Uevado a una inaceptable 
reduccion de la calidad de su producto. 

Para combatir esta tendencia, los analistas de Minot 
recolectaron 5 muestras de los pesos medidos en gramos 
del plomo que se utiliza para producir la cristaleria grande 
con pie o talio. A continuation se registran los datos: 


Muestra 


1 

2 

3 

4 

5 

5.2 

5.8 

10.3 

4.9 

8.9 

6.3 

6.8 

13.5 

9.5 

5.8 

7.5 

4.5 

12.5 

6.8 

47 

7.9 

6.8 

14.9 

8.9 

2.9 

8.2 

9.5 

9.2 

2.8 

4.5 

3.2 

4.5 

8.9 

4.5 

6.2 

8.9 

6.5 

6.2 

6.5 

3.5 


EN ESCENA 

Ademas, se analizan 10 muestras de tamano 50 cada 
una y se encuentra que el numero de unidades defectuosas 
en cada muestra es 5, 6, 10, 15, 2, 5, 19, 3, 0 y 15. 
Finalmente, se seleccionan 20 cajas aleatoriamente. Se 
inspecciona cada una y se registran los defectos para todas 
las 20: 


Caja 

Numero 
de defectos 

Caja 

Numero 
de defectos 

1 

3 

11 

5 

2 

5 

12 

6 

3 

0 

13 

3 

4 

8 

14 

2 

5 

10 

15 

8 

6 

5 

16 

8 

7 

2 

17 

7 

8 

8 

18 

5 

9 

1 

19 


10 

5 

20 

8 


Como director de calidad del producto, su fimcion es 
construir las cartas de control apropiadas y reportar sus 
descubrimientos en forma de reporte estadistico tal y como 
se describio en el apendice I. 


Del escenario a la vida real 

Como director de calidad del producto en Minot Industries, del ejercicio de Puesta en escena, es probable que 
usted sea un miembro del Centro Norteamericano de Productividad y Calidad ( American Productivity and Quality 
Center - APQC). Si es asf, usted puede obtener una amplia variedad de apoyo por parte de esta organization en la 
realization de su trabajo. Una visita al sitio web de APQC (http://www.apqc.org) le proporcionara los seminarios 
y publicaciones de capacitacidn disponibles que se relacionan con sus metas en Minot. 

En la pagina de presentacion, haga clic en Benchmarking, una forma de desarrollar estandares de calidad. En 
la siguiente pagina, se observa la lista de seminarios de capacitacion. Analice varias de las ofertas y haga una lista 
de algunas que tienen que ver directamente con el trabajo que usted esta dirigiendo en Minot. Luego regrese a la 
pagina de Benchmarking y despldcese por la lista de articulos y publicaciones. Haga una lista de algunos que 
tengan que ver directamente con la situation de Minot. 

Regrese a la pagina de presentacion de APQC y haga clic en el area de Productivity and Quality (Productividad 
y Calidad). De nuevo, piense en los recursos de APQC que le ayudaran a tener exito en su trabajo en Minot 
Industries. 
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un informe de negocios 
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A.1 Introduccion 

En la medida en que el entomo de los negocios se 
tome cada vez mas complejo, la importancia de una 
excelente comunicacion resulta esencial para lograr 
las metas institucionales. Ademas de la necesidad de 
desarrollar destrezas estadisticas adecuadas, se 
requiere un metodo capaz de comunicar a los demas, 
de manera efectiva, los resultados de los estudios 
estadisticos. Resulta de poca utilidad formular 
soluciones a problemas de negocios sin transmitir 
adecuadamente esta informacion a quienes estan 
involucrados en el proceso de solution. La importancia 
de comunicar eficazmente los resultados de un estudio 
estadistico nunca sera exagerada. 

Infortunadamente, parece que muchos gerentes 
de empresa no cuentan con suficientes destrezas de 
comunicacion. El ejemplo de diciembre de 1990, del 
Training and Development Journal , senala que 
“Ejecutivos entrevistados en un estudio reciente, le 
restan importancia a la falta de destrezas para escribir, 
en los candidatos a un cargo”. Un informe publicado 
en un numero de 1993, de la Management Review , 
alude a la “desventaja impuesta a los negocios por 
deficiencia en las destrezas para escribir”. El informe 
establece que los empresarios estan comenzando a 
dar un mayor enfasis a la comunicacion en sus 
metodos de contratacion. Muchos de ellos han 
adoptado politicas que exigen a los candidatos a un 
cargo presentar un breve informe escrito, como parte 
del proceso de selection. En agosto de 1992, el 
Marketing News revelo que los “empresarios buscan 
comunicadores motivados para ingresarlos a 
posiciones en el nivel de marketing”. Obviamente, la 
presion causada por la carencia de adecuadas 
destrezas de comunicacion y redaction en las 
empresas estadounidenses, se encuentra bien 
documentada. 

Por consiguiente, el proposito de este apendice es 
el de ilustrar algunos de los principios de la 
comunicacion en negocios y la preparation de informes 
de negocios. Se estudian el proposito general y las 
caracteristicas esenciales de un informe y se hace 
enfasis en los beneficios de un informe bien escrito. 
Este enfasis se pone en el formato habitual que debe 
tener un informe de negocios y el objetivo de cada 
una de sus partes. Se estudian ejemplos de informes 
practicos y los problemas brindaran al lector la 


oportunidad de desarrollar y aguzar sus destrezas de 
comunicacion. 

A.2 La necesidad 
de comunicarse 

La mayor parte de las decisiones de negocios implican 
la cooperation e interaction de varios individuos. En 
ocasiones, docenas de colegas y colaboradores se 
esfuerzan al umsono para alcanzar metas comunes. 
Por tanto, deben mantenerse llneas de comunicacion 
que faciliten estos esfuerzos conjuntos. Sin comunicar 
las ideas y los pensamientos, seria imposible 
identificar los objetivos comunes y los propositos 
necesarios para realizar operaciones exitosas. Sin 
comunicacion y el esfuerzo del equipo la realization 
exitosa de cualquier proyecto importante puede verse 
en peligro. Adicionalmente se corre el riesgo de que 
algunos aspectos del proyecto se puedan repetir 
innecesariamente mientras que otras tareas quedarian 
sin atencion. Ademas, ante la falta de una comu- 
nicacion adecuada, los colegas se encontrarian 
trabajando en propositos diferentes y, quiza, buscando 
metas opuestas. A veces sucede que un miembro del 
equipo puede haber estado trabajando todo en un 
dia, con gran esfuerzo y otro puede desarticular el 
trabajo al siguiente dia. Sin una comunicacion 
adecuada las oportunidades para obtener exito en 
cualquier empresa de negocios, se reducen de manera 
significativa. 

A.3 Las caracteristicas 
del lector 

Con bastante frecuencia, los informes empresariales 
se dirigen a una amplia variedad de audiencias 
diferentes. Resulta esencial identificar cuidadosamente 
la audiencia a quien va dirigido un reporte pues, de 
otro modo, es probable que este este mal dirigido y 
sea menos efectivo. Se debe considerar con exactitud 
lo que ya saben los lectores del informe y lo que 
necesitan saber para tomar decisiones bien informadas. 

Tambien se debe considerar la actitud que la 
audiencia adoptara hacia el informe. Si su autor teme 
que los lectores pueden ser de algun modo hostiles 
hacia su reporte, quiza necesite ofrecer mas evidencia 
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y documentation para respaldarlo, si considera que esto 
puede favorecer su aceptacion. El nivel educativo y la 
experiencia laboral de la audiencia tambien son un factor 
clave en la presentacion de un informe. Un informe 
para ejecutivos de alto nivel diferira consider ablemente 
de uno preparado para supervisores de linea en 
terminos de estilo, vocabulario y complejidad. Incluso, 
edad, genero y otras caracteristicas demograficas 
pueden servir para orientar un informe. 

Una cosa es cierta. Si el autor del informe se gana la 
vida como contador, gerente de marketing, supervisor 
de production o representante de ventas, no trabajara 
dentro de un contexto vacio. Encontrara que es 
necesario comunicarse constantemente con los demas 
para lograr la plena realization de su trabajo. En otras 
palabras, cuanto mas grande sea la institution en donde 
trabaje, tanto mayor sera la necesidad de preparar 
informes escritos. A medida que la organization se 
vuelve mas compleja, lo mismo sucede con el grado 
necesario de la comunicacion formal. 

A.4. El proposito de los 
informes estadisticos 

Dada la importancia de la comunicacion, no debe ser 
una sorpresa que el objetivo principal de un informe 
sea el de transmitir informacion. En este esfuerzo, los 
reportes estadisticos han de ser bastante concisos y 
siguen un patron predeterminado. Este patron familiar 
permite reconocer con facilidad las caracteristicas 
esenciales y facilita al lector la comprension rapida del 
estudio. Para realizar un informe estadistico, se debe 
separar el problema y reunir los datos necesarios. La 
poblacion se debe identificar con claridad y se debe 
elegir la muestra con especial cuidado. Entonces, el 
investigador realiza el estudio y se prepara para informar 
los resultados. 

Como se indico antes, el procedimiento a seguir 
para estructurar un informe estadistico consta de varios 
pasos bastante precisos y bien definidos que solo se 
pueden modificar ligeramente. Luego de la pagina de 
presentacion (que se ilustra en el ejemplo posterior), el 
informe estadistico brinda un recuento de sus 
conclusiones y recomendaciones. Por lo comun, en un 
escenario de negocios este enunciado de apertura se 
conoce como resumen ejecutivo que, junto con las 
demas partes de un informe estadistico, se estudia a 
continuation. 


A. El resumen ejecutivo 

El proposito de un resumen ejecutivo es suministrar 
al lector carente de tiempo, los hechos mas repre- 
sentatives y los resultados mas importantes derivados 
del estudio. Este resumen pocas veces excede una o 
dos paginas. En el se resumen los hallazgos y 
conclusiones, junto con algunas recomendaciones, y 
se presentan al comienzo del estudio. Esta ubicacion 
permite un acceso facil a la informacion mas relevante 
para cualquier decision que un gerente necesite tomar. 
Si el gerente o lector esta interesado en algun detalle 
adicional, puede consultar el cuerpo principal del 
reporte. 

El resumen ejecutivo debe escribirse de una manera 
no tecnica, dado que los lectores en su mayoria son 
directivos de alto nivel cuya experiencia, a menudo, se 
encuentra en la gerencia de la empresa y no en areas 
tecnicas como quimica, fisica o, incluso, en muchos 
casos, estadistica, lo cual hace que se interesen poco 
en el aspecto tecnico del informe. Elios solamente 
quieren asegurarse de que han considerado todos los 
factores importantes para la empresa y que han seguido 
los procedimientos cientificos apropiados en la 
formulation del informe. Entonces, si el lector desea 
una explication tecnica mas detallada, puede leer 
cualquier otra parte adicional del informe. 


Resumen ejecutivo Enunciado de 
conclusiones y recomendaciones que se 
encuentra al comienzo de un informe. 


Aunque el resumen ejecutivo precede al informe 
cuando se presenta en su forma final, solamente se 
escribe despues de haber realizado el estudio y de haber 
completado el resto del informe. El resumen no debe 
incluir informacion nueva que no se encuentre en el 
informe y no debe ofrecer conclusiones con base en 
datos o informacion que no se encuentren en este. 


B. Introduction 

El segundo paso es una breve introduction que describe 
la naturaleza y alcance del problema. Se debe incluir 
cualquier historia o antecedente relevante del problema 
que resulte esencial para entender a cabalidad y aclarar 
el resto del estudio. Este enunciado se hace para explicar 
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por que la solution del tema en cuestion es importante y 
la apremiante necesidad de formular un curso de action. 

C. Metodologi'a 

La tercera seccion de un informe estadistico es mas tecnica 
que el resto del estudio, ya que explica la naturaleza exacta 
de las pruebas estadisticas que se realizaron. Describe 
en detalle las herramientas cuantitativas y cualitativas 
precisas que se usaron y revela la manera como ellas 
conduciran a los resultados deseados. Tambien se 
acostumbra presentar de manera sucinta el conjunto de 
datos y la manera como se tomo la muestra. Esto se ira 
volviendo familiar a medida que el autor de los informes 
alcance una mayor comprension del analisis estadistico 
y sus muchas aplicaciones. 

La metodologia que se utilice dependera 
principalmente de lo que se quiera lograr. Este hecho 
tambien sera mas evidente a medida que aumente la 
perspectiva que se tenga sobre el proceso del analisis 
estadistico, como se describio en este texto. 


D. Hallazgos 

En este punto es donde se realiza el analisis estadistico 
en si mismo. Los hallazgos estan integrados por los 
calculos estadisticos reales que suministra la informacion 
requerida para tomar decisiones y hacer reco- 
mendaciones. Estos calculos pueden variar desde 
tecnicas descriptivas simples hasta el mas avanzado 
analisis inferencial. Los calculos se presentan con detalles 
suficientes que permitan revelar y validar la prueba 
estadistica sin entregar informacion innecesaria o 
volverse demasiado pesado. 

Ademas, se presentan comentarios con respecto a 
los calculos para resaltar los resultados y dirigir la 
atencion hacia su signification. Es decir, los resultados 
de los calculos simplemente se citan o senalan como 
referenda. No se hace ningun esfuerzo para discutirlos o 
interpretarlos. Esto se deja para el siguiente segmento. 

E. Discusion e interpretation 

Con base en los hallazgos de la seccion anterior, ahora el 
investigador ofrece una discusion e interpretacion de las 
principales implicaciones del informe. Tambien debe 
proporcionar una interpretacion de los hallazgos de 


manera significativa y que no sea tecnica. Esta 
seccion tiene un impacto considerable sobre la 
formulation de soluciones, para el problema descrito 
en la introduction y que motivo el informe. 

F. Conclusiones 

y recomendaciones 

A menudo, este segmento final repite parte de la 
informacion que se encuentra en el resumen ejecutivo, 
aunque permite que el investigador explique con 
mayor detalle el como y el por que de las conclusiones. 
Tambien se puede incluir un analisis mas detallado 
de las recomendaciones. Resulta importante que esta 
seccion se base en los resultados de los hallazgos y 
que no ofrezca conclusiones o recomendaciones que 
no se encuentran respaldadas por el analisis. 

Si los reportes se preparan en esta forma 
organizada, son mas utiles y le dan al investigador un 
sentido de credibilidad y autoridad. El reporte 
transmitira respeto a quienes confian en el para tomar 
decisiones importantes. 

A.5 llustraciones 
y ejemplos 

Se puede lograr una imagen mas completa de los 
reportes y resumenes financieros utilizando ejemplos 
de problemas de caso especificos. Primero se mirara 
un informe estadistico disenado para ayudar en la 
toma de una decision con respecto a la ubicacion de 
una planta en expansion. Una decision de esta 
naturaleza probablemente lleve a un informe completo, 
en oposicion a un resumen, debido al costo 
involucrado y al efecto a largo plazo del sitio donde 
se ubique la planta. 

En realidad, una decision de esta clase requiere 
de un analisis estadistico que va mas alia de las simples 
herramientas descriptivas que se presentaron en esta 
obra. Sin embargo, se tratara el tema de la expansion 
de la planta solamente con los analisis descriptivos 
simples descritos en los dos primeros capitulos de 
este texto. Con esta limitation en mente, se comienza 
el estudio del reporte que se presentara para tomar la 
decision de la ubicacion de la planta. 

Usted ha sido contratado como analista 
administrative por Global Motors (G.M.), Inc., una 
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empresa ubicada en Detroit, Michigan. El sehor 
Sumner, CEO de GM, ha solicitado que su division 
administrativa prepare un informe estadistico sobre la 
factibilidad de construir una nueva planta de montaje. 
En consideration para el sitio se encuentran cuatro 
ciudades: Houston, Detroit, Pittsburgh y Boston. 
^Cual seria su respuesta? 

Despues de la pagina de presentacion, el informe 
contendra el resumen ejecutivo (recuerde que en este 
se sintetizan todos los hallazgos principales, 
conclusiones y recomendaciones, solamente despues 
de haber concluido todo el estudio). La pagina de 
presentacion podria tener un aspecto como el 
siguiente: 

SITIOS ALTERNOS PARA UBICAR LA PLANTA 
PARA EL PLAN DE EXPANSION 1 988 DE GLOBAL 
MOTORS 

Presentado a Samuel Sumner 
Director ejecutivo (CEO) 
de Global Motors International 
Oficina principal 
Detroit, Ml 

Preparado por Jarrod Hirsch, Jefe de la Division 
Administrativa de Analisis 
Division de la Oficina Principal 
Global Motors International 
Chicago, IL. 

Agosto 10, 2000 

A. El resumen ejecutivo 

El resumen ejecutivo podria ser como sigue: 

Tras un cuidadoso estudio de todos los aspectos 
relevantes, la Division Administrativa de Analisis 
recomienda que se elija la ciudad de Houston 
como el sitio para la instalacion de la nueva planta 
de expansion de Global Motors. Despues de un 
profundo analisis, la division ha encontrado que 
Houston ofrece mas de los requisitos de 
instalacion y comodidades para la culminacion 
exitosa del proyecto de expansion. 

La Division considerofactorestecnicos como 
disponibilidad de mano de obra con el 


entrenamiento o entrenamiento potencial 
necesario, lo mismo que con las tarifas salariales 
en vigencia. Analizamos el acceso geografico para 
las materias primas. Concluimos que las 
instalaciones locales de transporte eran 
adecuadas para acomodar el volumen de carga 
requerido para las operaciones de montaje. 

La cooperation con los gobiernos local y 
estatal en el area de Houston parece asegurada. 

La Oficina del Procurador General del Estado ha 
ofrecido algunos incentivos tributarios que 
superaron los que se encontrarian en otros sitios 
potenciales. Ademas, la ciudad de Houston ha 
aceptado dar un plazo a Global Motors para pagar 
los impuestos sobre propiedad y ventas a la 
ciudad, por un periodo de dos anos. 
Adicionalmente, Texas es un estado en donde 
rige la ley que prohibe la obligation de los 
trabajadores de pertenecer a un sindicato. Ese 
no es el caso en los demas estados en donde se 
encuentran localizados los otros sitios propuestos. 

La Division hizo una amplia compaction de 
las instalaciones tanto para los trabajadores de 
administration como para los operarios. Nuestros 
resultados indican claramente que el mercado 
de Houston ofrece mejores oportunidades con 
tasas hipotecarias razonables. Tambien 
concluimos, despues de una completa evaluation 
comparativa, que las escuelas de Houston eran, 
por lo menos, comparables con las de los otros 
sitios potenciales. 

Por consiguiente, recomendamos seleccionar 
un equipo de transition para asistir a nuestro 
personal clave que temporalmente estara en las 
nuevas instalaciones. Tambien se puede 
conformar un equipo para mantener contacto 
con los funcionarios apropiados tanto de 
organizaciones pubiicas como privadas, y asi 
facilitar la culminacion del proyecto de expansion. 

Observe que el resumen ejecutivo ofrece una serie 
de conclusiones que se basan en los hallazgos, y 
recomendaciones que surgen logicamente de la 
information que contiene el estudio. De otro lado, se 
hacen los esfuerzos necesarios para garantizar que se 
hayan incluido todos los aspectos esenciales. Se 
presto atencion a factores que van desde los impuestos 
para el negocio hasta los servicios de education para 
los hijos de los empleados. 
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B. Introduction 

La introduccion es el siguiente componente del 
formato del informe estadistico. Se debe recordar que 
en ella se trata cualquier asunto relevante y se da 
claridad acerca de por que el tema en cuestion requiere 
de una solucion. 

Desde 1990, las instalaciones de produccion de 
Global Motors han sido inadecuadas para 
mantener el ritmo requerido por el nivel de 
produccion. Se preve que la demanda aumentara 
en el futuro proximo. Con base en estos eventos 
historicos y de proyeccion, resulta esencial que 
se identiflque un sitio viable para la pianta con el 
proposito de ampliar la capacidad de produccion 
de Global Motors. 

A menos que las instalaciones de produccion 
se puedan ampliar de una manera adecuada, es 
probable que la participation de mercado de 
Global Motors resulte afectada y que la firma 
quede en una position de desventaja competitiva. 

Los estudios de la industria han demostrado que 
los competidores de GM ya han aumentado su 
capacidad de produccion o planean hacerlo en 
un futuro cercano. 


C. Metodologfa 

La seccion de metodologia especifica cuales son las 
herramientas que se utilizaran para realizar el estudio. 
Como se indico antes, ya que se han examinado solo 
las herramientas descriptivas basicas, el analisis se 
restringira a la seleccion del sitio de la pianta 
unicamente para estas herramientas. En la realidad, 
claro esta, se utilizaran muchos otros tipos de 
herramientas. Esta seccion tambien incluye una breve 
description del conjunto de los datos. 

METODOLOGIA 

Se aplicaran varias herramientas descriptivas a 
los datos recopilados con el fin de realizar este 
estudio. Se utilizaran tablas de distribution, tablas 
de contingency y numerosos graficos para 
determinar analiticamente el sitio optimo para la 
expansion de la pianta de Global Motors. Cada 
una de estas herramientas se aplicara a los datos 
obtenidos en las cuatro ciudades. El proposito 
sera suministrar una base de comparacion 


suficiente para permitir llegar a un argumento 
concluyente sobre cual es el sitio preferible. 

Los datos de distintas variables relevantes se 
han obtenido directamente de gobiernos locales 
en las areas propuestas para el sitio, lo mismo 
que de publicaciones. Estas publicaciones que 
han servido como fuente incluyen a Survey of 
Current Business y a Urban Economies. Estos 
datos se utilizaran en un analisis comparative de 
lossitios propuestos. 

Se puede observar que en esta seccion se enumera 
y explica la metodologia y la manera como se emplearan 
las herramientas para llegar a una conclusion. 


D. Hallazgos 

Esta seccion contiene los calculos estadisticos reales. 
Consta de una presentation en donde se comparan 
los cuatro sitios, usando las diferentes herramientas 
descriptivas. El diagrama de barras muestra los 
incentivos tributaries en cada ciudad, las tablas de 
frecuencia reflejan los costos de las viviendas en cada 
uno de los mercados locales, y las tablas de 
contingencia reflejan las vias de transpose. 

Las estadisticas relevantes presentadas en el 
analisis descriptivo se comunican en esta seccion de 
una manera formal. Suponga, por ejemplo, que el 
analisis de datos revela lo siguiente: 

Tabla A, que es una tabla de frecuencia de los costos 
de vivienda para 1,000 hogares investigadas en 
Houston, revela que el costo promedio de las viviendas 
es mas bajo en esa ciudad. Como se presenta en la 
tabla, 56% de todas las casas estan en el nivel de 
US$100,000 a US$120,000, Pittsburg ofrece un 
promedio de US$120,000. 

Tabla A 

Tabla de frecuencia para costos de vivienda 
en Houston (en miles US$) 

Costos de vivienda Frecuencia 


60 


80 

92 

80 

£ 

100 

115 

100 

£ 

120 

560 

120 

£ 

140 

135 

140 


160 

98 

1,000 
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El cuadro 1 revela que Houston ofrece acceso 
a 56°/o de toda la materia prima necesaria en un 
lapso de 24 horas, mientras que en los demas 
sitios potenciales existe el riesgo de retrasos hasta 
por 72 horas. 

El cuadro 2 sobre costos de transporte en todas 
las ciudades demuestra que el nivel de costos 


esta entre US$320 por mes hasta US$512 por 
mes. El mas bajo es Detroit. 

El cuadro 3 sobre incentivos tributarios muestra 
que el ahorro total en impuestos en Houston debe 
alcanzar la suma de US$2,000,000. En Detroit, 
sin embargo, los ahorros se proyectaron en una 
cifra de US$500,000. 


Cuadro 1 

Diagrama circular 

Numero de horas necesarias 
para recibir la materia prima 

Porcentaje 
de materias primas 

Grados 

en el diagrama circular 

sobre el acceso 

24 

56 

360 X .56 = 201.6 

de las materias 

36 

24 

360 X .24 - 86.4 

primas en Houston 

48 

11 

360 X .11 = 39.6 


60 

9 

360 X .09 = 32.4 

360.0 



Cuadro 2 

Promedio mensual 
de costos 
de transporte 
para todas 
las ciudades 



Cuadro 3 

u 2.00 

Ahorro en impuestos 

1 1.75 
<□ 

durante el primer 

g, 1.50 
J 1.25 

ano de operaciones 

5 i.oo 

(en millones 

§0.75 

de dolares) 

S 0.50 
< °- 25 


Houston 


Detroit Pittsburgh Boston 
Ciudad 
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Se puede observar que en esta section de hallazgos 
los resultados no estan unidos a ninguna 
interpretacion o significado. En esta section, las cifras 
se citan; solamente hay una description o 
contabilizacion de los datos. 

E. Discusion e interpretacion 

La section de discusion e interpretacion ilustra los 
hallazgos relevantes y ofrece una explication. A partir 
de los hallazgos, se presume que la discusion e 
interpretacion siguientes, son posibles: 

Los hallazgos que se encuentran en el diagrama 
eireularsobreel accesoa losmercadosde materia 
prima, revelan que Houston ofrece la mayor 
posibilidad de acceso para todos los materiales 
necesarios dentro de un lapso de 24 horas. Los 
otros sitios propuestos presentan un periodo 
mucho mayor. Esto sugiere que los costos de 
transporte serian mas altos. Ademas, la 
planeacion de la production seria mas dificil. 
Como se muestra en las tablas de frecuencia, los 
costos de vivienda mas bajos en el area de 
Houston significan que los salarios podrian estar 
a un nivel mas bajo, minimizando los costos de 
manodeobra. 

Aunque Pittsburgh cuenta con costos de 
vivienda mas bajos en general, el mercado de 
finca raiz en esa ciudad ha sufrido una caida 
recientemente. Si esto continua, puede ser 
evidencia de que las viviendas compradas por 
nuestros empleados podrian convertirse en una 
inversion equivocada. 

Los cuadros de barras reflejan una 
inestabilidad considerable en los gobiernos de las 
ciudades en varios de los sitios sugeridos. Esto 
indica que cualquiera que decida realizar 
operaciones de negocios en estas areas puede 
enfrentarse a condiciones de inestabilidad politica 
graves. 

La tabla de contingencia revela que los niveles 
de salarios y los indices de desempleo parecen 
favorables para actividades de expansion en 
Houston y en Detroit. Sin embargo, con base en 
los indices proyectados en Detroit, podria 
interpretarse que esta tendencia no continuara. 

Dadas las numerosas herramientas descriptivas 
examinadas en este texto, y las distintas variables 


citadas en el estudio de GM, result a posible realizar 
un trabajo de discusion e interpretacion adicional. Sin 
embargo, este debe ser suficiente para ilustrar que 
esta section presenta los hallazgos mas relevantes 
para suscitar la atencion del lector y ofrece alguna 
interpretacion significativa. Las cifras ya han sido 
citadas en la section anterior de los hallazgos. Ahora 
es esencial dar significado e interpretar estos numeros. 

F. Condusiones 

y recomendadones 

La section final del reporte es la de condusiones y 
recomendaciones. En ella se puede repetir parte de la 
information que se encuentra en el resumen ejecutivo. 

Despues de revisarcuidadosamente lasdiferentes 
medidas de indices de negocios y calidad de vida, 
la Division Administrativa de Analisis recomienda 
que la ciudad de Houston sea seleccionada como 
sitio de expansion. Houston presenta las 
condiciones mas deseables para esta selection 
con respecto a las demas localidades posibles. 

Los hallazgos sugieren con firmeza que 
Houston promete, por lo menos, exito potential 
en todas las caracteristicas examinadas en el 
estudio. Ademas, presento un factor de exito mas 
alto que el promedio cuando se consideraron 
todas las variables. 

En la opinion analizada por la division, 
Houston es el primer sitio a considerar con fines 
de expansion. Esta conclusion se basa en un 
estudio profesional y objetivo, que considero todos 
los factores pertinentes. 

Aunque este ejemplo de un informe estadistico de 
negocios contiene todos los elementos esenciales y 
demuestra los principios basicos inherentes a la 
realization de un informe escrito, no se debera tomar 
como un modelo especifico para cualquier clase de 
informe. Todo informe debe ajustarse a la naturaleza 
del problema en estudio, la disponibilidad de datos y 
el caracter general y la personalidad de quienes lo 
preparan. Otros factores que influyen en su caracter y 
buena disposition, alteraran la forma final del informe. 
Se deben hacer todos los esfuerzos necesarios para 
transmitir en la creation del producto final, el estilo y 
la manera personal de quien escribe el informe. 
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Capitulo 2 


2. a. 9 

b . 0.84; redondeo a US$1,000 

c. Las respuestas variaran 


Education 

Nivel 





administrative 1 (10-12) 

2 (13-15) 

3(16+) 

Total 

i 

7 

4 

0 

11 

2 

5 

8 

1 

14 

3 

1 

3 

5 

9 

4 

0 

2 

9 

11 

Total 

13 

17 

15 

45 


Un nivel mas alto de education parece asociado con un 
nivel administrative mas elevado. 


Tallo 

Hoja 

3 

2, 6,7 

4 

2, 6, 7, 7, 8 

5 

4, 5,5 

6 

2, 7, 8, 9 

I.C. = 

120,000 

Intervalo de clase 


0 < 120,000 

120.000 < 240,000 

240.000 < 360,000 
Etc. 


16. 


Tallo 

Hoja 

5 

1,5,9 

6 

5,8 

7 

0, 2,3 

8 

3, 4, 5, 5, 7, 8 

9 

1,1,3, 8,9 

10 

0, 2,3 

11 

0, 5,7 

12 

3,7 

13 

2,4,7 

14 

2,3 

15 

0,2,3 

16 

0, 3, 3, 7 

17 

0, 3,5 


Clase 

Frecuencia 

M 

Frecuencia 

relativa 

5 y menos de 7 

5 

6 

5/42 = 0.119 

7 y menos de 9 

9 

8 

9/42 = 0.214 

9 y menos de 11 

8 

10 

8/42 = 0.190 

11 y menos de 13 

5 

12 

5/42 =0.119 

13 y menos de 15 

5 

14 

5/42 = 0.119 

15 y menos de 17 

7 

16 

7/42 = 0.167 

17 y menos de 19 

3 

18 

3/42 = 0.071 


42 


1.00 


c. 2 c >42;c*-6 
17.5 - 5.1 

I.C.= = 2.06 ** 2.00 

6 


Distribution o mas de frecuencia acumulada 


Clase Frecuencia acumulada 


5 o mas 

42 

7 o mas 

37 

9 o mas 

28 

11 o mas 

20 

13 o mas 

15 

15 o mas 

10 

17 o mas 

3 

19 o mas 

0 


Rango 


Estado 

US$0 

hasta 

4,999 

US$5,000 

hasta 

9,999 

US$10,000 US$15,000 Total 
hasta y mas 

14,999 

Vencido 

10 

(0.083) 

15 

(0.125) 

11 

(0.092) 

5 

(0.042) 

41 

(0.342) 

Vencido y 

5 

10 

10 

7 

32 

no pagado (0.042) 

(0.083) 

(0.083) 

(0.058) 

(0.267) 

En mora 

10 

(0.083) 

12 

(0.10) 

18 

(0.15) 

7 

(0.058) 

47 

(0.392) 

Totales 

25 

(0.208) 

37 

(0.308) 

■JQ 

(0.325) 

19 

(0.158) 

120 

(1.00) 


Capitulo 3 

2. X = 15.24 
Mediana = 19.8 
Moda =21.6 y 22.3 

4. Plan 1:27.5% 

Plan 2: 5.7% 
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8. Curly X = 2383 
S = 1775 
Moe X = 638.4 
S- 217.7 
Larry X = 534 
5-0 

Curly ha tenido la media mas alta, pero Larry es mas 
consistente. 

10. Resultado: 

X = 10.41 
Mediana = 10.17 
Moda = 10 

12 . a. P 15 - P 15 = 62.25 - 20.75 = 41.5 
bJc . p 50 = Mediana— 38 
d. P 10 = 56 
^30 ~ 27 
14 . a. 68.3% 

b. 95.5% 

c . 99.7% 

0.15% 

<?. 15.85% 


16 . CV edad = 22.6 

CVingresos 18 


18 . 

a . 

X = 45.304 

Mediana = 39.5 

Moda = 69.875 


6 . 

5 2 = 312.02; 5- 17.664 


c. 

RICE - 40.625 


d. 

P m = 38.8 

20 . 

a. 

X = 6.939 


b. 

0.424 


c. 

5 = 0.276 

22 . 

US $1.90 

24 . 

US $3.07 por pie 

26 . 

a. 

US$6,925 


b. 

US$28,265 por accion 

28 . 

a. 

X = 1077 



Mediana = 965 

Moda - 673.33 


b . 

CV edad = 9.98 

CV salario = 61.04 

32 . 

s - 

= US$1.78; IQR = 3.62 

34 . 

a . 

42 


6 . 

267.43 


c. 

16.35 



20.5 



20.5 


/ 

30.5 

36 . 

** 

= 14 


Mediana— 13,882 
Moda = 13.8 


38 . p ~ 0 

40 . a. X A = 82.14 = 71.5 

Mediana de ^4 — 82 Mediana de B — 1 1.5 
Moda de A = 75 Moda de 5= ninguno 

b. s A — 12.034 = 15.35 

42 . a. = 7.3367 
5 = 1.5464 
fc. 22.5 

c . 29 i.e. h7; 25 

44 . a. P^ = 23 

P 25 = 14.29 
P 50 = 20.5 
P 75 = 26.25 
6 . /% = 10 
Pso = 31.67 


Capitulo 4 

4 . Errado, Los lanzamientos son independientes. 


6 . 

a. 

27/52 


b. 

16/52 


c. 

9/52 


d. 

36/52 

10 . 

(BUD) Todas * as mu J eres sin tener en cuenta su 
educacion o todos los no graduados sin tener 



en cuenta el genero. 


(B n D) Todas las mujeres sin educacion. 

14 . 

a . 

0.332 


b . 

0.083 


c. 

0.083 


d. 

0.167 

16 . 

a. 

0.385 d. P(S | G) = 0.385 


b. 

P(S \ A) = 0.385 P(E 1 G) = 0.615 

P(S I C) = 0.385 P(C j G) = 0 


c. 

P(C | P) = 0.227 

P(C|A) = 0.308 

18 . 

a. 

0.80 


b. 

0.42 


c. 

0.40 


d. 

0.40 


e. 

0.78 

20 . 

a. 

0.50 


b. 

0,10 


c. 

0.90 


d. 

0.70 

22 . 

a . 

0.2275 


b. 

No 

24 . 

P(S 

\M) = 0.10 < 0.30; si 

26 . 

720 

28 . 

24 
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30 . 

a. 

37/75 


b. 

2/75 


c . 

21/75 


d. 

18/75 


e . 

56/75 


/ 

61/75 

32 . 

a. 

3/120 


b. 

18/120 


c. 

65/120 


d. 

34/120 


e . 

37/120 


/ 

102/120 

34 . 

0.15 *0 

36 . 

0.0417 


38 . 17 , 576,000 
40 . 56 . 25 % 

42 . 68.94% 


Capitulo 5 


4 . 


- 2.82 


o 2 

= 3.76 


a 

= 1.95 

8 . 

1.8 


10 . 

a. 

0.1209 


b. 

0.1115 


c. 

0.9452 


d. 

0.6331 


e. 

0.7779 

12 . 

0.2403 

14 . 

0.1231 

16 . 

0.1833 

18 . 

a. 

0.1363 


b. 

0.8647 


c. 

0.3067 


20 . 0.9896 > 0.30; 

inventario de camisetas 

22 . 0.8647 
24 . 0.9975 
26 . 0.9907 

28 . a. 13.9 y 18.1 
h . 0.167 

30 . 61 . 7 % 

32 . a. 0.2643 

b. 0.7357 

c. 0.7503 

d. 0.0292 


34 . 

a . 

50% 


b. 

16.11% 


c. 

98.75% 



38.50% 

36 . 

a. 

US$27.80 


h. 

US$19.82 


c. 

US$27.80 


d. 

US$22.87 


38. 0.0002 

40 . a. 0.2270 

b. 0.1582 

c. 0.0834 

d. 0.9972 

42 . 0.0895 
44 . 0.9958 
46 . US$920.50 

50. a. 33.3 hasta 36.7 
b. 0.2941 

52 . 0.2138 

58. 0.7764 

60 . 340.4 unidades 

62. 99.18 dias 

64 . 933.8 > 900; no 

66. 0.8438 

68. 0.9222 


Capitulo 6 

2 . 

X = 220 


= 31.22 

4 . 

3.95 

10 . 

a. 0.9772 

b. 0.9772 

c. 0.9818 

12 . 

0.1646 

14 . 

0.0668 

16 . 

0.1251 

24 . 

0.0375 

26 . 

0.0082 

28 . 

0.0901 

32 . 

87.28 unidades 

34 . 

a. 0.1587 

b . 0.0548 

36 . 

0.3544 
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38 . 0.7704 
40 . 0.3936 

42 . Solo hay un 7.64% de probabilidad de que si su 
computador hubiera perdido 9% de tiempo durante las 
ultimas 90 horas, se habrfan perdido 12 horas. 

44 . a. cr p — 0.044 

b. P = 0.45 

c. 0.2483 

Capi'tulo 7 

4. 15.01 < /x < 15.38 
6. 6.00 < }jl < 6.40 

8 . 52.32 < fx < 57.64 
10 . 15.95 < /x < 17.25 

12 . n < 30; or desconocida; se supone que la poblacion 
es normal. 

14 . 14.82 < fx < 15.58 

16 . 58,760 < /I < 73, 020 
18 . 1736 < /x < 2994 

20 . 0.62 s 7T < 0.70; sf, 68% esta en el intervalo. 

22 . 0.27 <77 <0.31 

24 . 0.79 < 7r < 0.85 

26 . 73 

28 . 51 

30 . 167 

32 . 1359 

36 . 0.4799 < /x < 0.560 
38 . a. 693.8 < /x < 696.2 

b . GP puede confiar en 90% de que el pabelldn tendra 
un promedio entre estos dos valores 

c. No 

40 . 1.73 < /x < 1.85 

42 . 13.274 < ft < 14.926 

44 . 14.9 < fj, < 15.7 

46 . 95% 

48 . 11.53 < fx < 14.31 

50 . 44.05 < ^ < 50.55 
52 . 78.56 < fi < 87.84 
54 . 0.823 < 7T < 0.937 

Aunque FOA tiene un intervalo mas alto, la 
superposition sugiere que no puede existir diferencia 
en la proportion de clientes satisfechos. 

56 . 6.95 < jjl < 7.65 

58 . 12.25 < fx < 12.75; no subir el precio. 


60 . a. 0.623 < tt < 0.757 

b . 0.647 < tt < 0.733 

c. El intervalo mas pequeno resulta de un nivel mas 
bajo de confianza. No, porque usted debe aceptar 
un nivel de confianza mas bajo. 

62 . 112 
64 . Ill 

66. 0.5339 < tt < 0.7661 
68. 0.235 < 77 < 0.285 

No; 30% no esta en el intervalo. 

70. 154 
72 . 757 

Capi'tulo 8 

10 . H () : fx = 2,100; Z = 1.49 esta entre ±1.96; no 
rechazar. 

12 . H 0 : /x = 58; Z = —1.24 esta entre ±2.58; no 
rechazar. 

14 . H 0 : jx = 12; Z = —3.18 < -1.65; rechazar. 

16. H 0 : /x == 32,533; Z = 0.77 esta entre ±2.58; no 
rechazar. 

18. El signo “igual” debe aparecer en la hipotesis nula para 
darle algiin valor especifico a la prueba. 

20 . H 0 : fx < 7,880; Z = 0.50 < 2.33; no rechazar. 

22 . H 0 : fx S 34.4; Z - -4.04 < -1.75; rechazar. 

24 . H 0 : /x ^ 10,000; Z = —5.84 < —2.33; rechazar; si. 
26 . H 0 : fx 2s 325,500; Z = 0.25 > —1.65; no rechazar; 

S1. 

28 . H 0 : fx - 800; Z = -1.20 esta entre ±1.96; no 
rechazar; valor p = 0.5000 - 0.3849 = 0.1151( 2 ) = 
0.2302 

30 . H q : fi < 283; Z = 0.91 < 2.33; no rechazar; 
valor/? = 0.1814 

32 . H 0 : /x < 27,400; Z = 2.60 > 1.65; rechazar; 
valor/? = 0.5000 - 0.4953 = 0.0047. 

34 . H 0 : /x < 5,775; / = 0.9395 < 2.624; no rechazar; 
discontinuar el programa. 

36 . H 0 : fx ^ 5000; t = 0.31 < 1.711; no rechazar. 

38. H 0 : fx — 25; r = -0.91 esta entre ±2.797; no 
rechazar. 

40. H q : jx = 500; t ~ 1.054 esta entre ±1.761; no 
rechazar. 

42 . H 0 : 77 < 0.35; Z = 0.51 < 1.65; no rechazar; no. 
Valor/? = 0.5000 - 0.1950 = 0.3050 

44 . H 0 : 77 = 0.21; Z = -2.60 < -1.96; rechazar; 

Valor/? - 0.5000 - 0.4953 = 0.0047(2) = 0.0094. 
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46. H 0 : ir ^ 0.70; Z = -1.69 > -2.05; norechazar; 
sf, implementar el programa. 

54. H q : jjl= 18; Z = 1.35 esta entre ±1.96; no 
rechazar. No ajustar. 

Valor/? = 0.1819 

56. H 0 : /x = 115,000; Z = 0.272 esta entre ±1.81; 
no rechazar. 

Valor/? = 0.7868 

58. H 0 : jji 3.1;/= —0.63 esta entre ±3. 106; no 
rechazar. 

60. Hq. 7 r = 0.25; Z = —2.64 < — 1.65; rechazar; 
valor/? = 0.0041. 

62. H q : /x ~ 0.30; t = —1.06 esta entre ±3.707; no 
rechazar; sf, Dean esta feliz. 

64. H 0 : 77 = 0.50; Z= 1.41 esta entre ±1.96; no 
rechazar. 

66. H () : /x s 0.25; Z = —3.25; rechazar. 

68. H 0 : fi ^ 52,500; Z — 1.58 entre ± 1.65; no 
rechazar; el nuevo tiempo no es mejor. 

70. a. H 0 : /x ^ 57; Z = 2.34 > 2.33; rechazar; 
modiflcar longitud. 
b. Valor/? = 0.0096 

72. H 0 : 7i ^ .53; Z = 1.45 < 1.75; norechazar; 
el dinero no se invierte bien. 

Capitulo 9 

2. -5.77 < (/x 1 - /x 2 ) < 0.177 

4. -0.037 < (/X, - fi 2 ) =£ 0.417 

6. Las poblaciones son normales o casi normales; 
muestra pequena; a 2 desconocida. 

8. -17.65 < (/x, - /x 2 ) < 8.05; no, el intervalo 

contiene cero, sugiriendo que no hay diferencia. 

10. -27.39 < (/X, - fx 2 ) < 330.62 

12. 0.99 < (fi { - /x 2 ) < 4.44 

14. 0.072 ^ {fi F - fi N ) ^ 5.27; jugaren Nugget. 

16. -2.94 s {fi , - /x 2 ) < 0.59; como el intervalo contie- 

ne cero, no hay diferencia en la inversion que se elija. 

18. 1.425 ^ (/x 5 - jjij) < 5.058; ya usted obtiene valores 

positivos de /x 5 - /x r , /jl s > fi T . 

20. -0.114 < (7r,.„ a - £ -0.026; /x„„. 

22. H 0 : Mi ~ /x 2 ; Z = -2.91 < -2.33; rechazar. 

24. tf 0 : /Xj - fi 2 ; t = -1.836 estd entre ±2.921; 
no rechazar. 

26. H 0 : /X, < /x 2 ;Z = 1.71 > 1.65; rechazar. 

28. Hq. /Xj - /x 2 ; t = 10.46 > 2.064; rechazar. 


30. Hq. 77, ^ 77 2 ; Z = 1.43 > 1.28; rechazar. 

32. -0.048 < (/X, - /x 2 ) < 0.408 

34. 1.343 < (/x, - /x 2 ) < 3.657 

36. -9.474 < (/x, - /x 2 ) < -2.526 

38. -22 < (/x, - /x 2 ) < 38.4 

40. 4268 (/x, - /x 2 ) < 12,932 

42. -3.78 < (/x, - /x 2 ) < 16.383 

44. a. 86 < (/x, - /x 2 ) < 136 
/?. n = 182 

46. —15.366 ^ (/x, - /x 2 ) ^ —7.634; usted puede confiar 

en 95% en que la expectativa media de vida de los 
alcoholicos tiene entre 7,634 anos y 15,366 anos menos. 

48. 0.6122 =£ (/x, - /x 2 ) ^ 0.6378; usted puede confiar 
en 99% en que el cambio en el precio medio esta 
entre 610 y 640 mas en los dfas viemes. 

50. -9.343 < (/Xj - /x 2 ) < 51.143 
52. -1.026 < (/i, - /x 2 ) <0.134 

54. 0.1841 < (/x, - /x 2 ) < 0.2759 

56. 0.796 ^ (/x, — /x 2 ) ^ 6.204; conservar la maquina 
antigua. 

58. H 0 :(jjl f = /x c ); t = 2.65 > 2.711; rechazar, concluir 
jx F - /x c dado que X F > X c . 

60. a. -0.0074 < (/x, - /x 2 ) < 1.4074; como el inter- 
valo contiene cero, parece que no existe diferencia; 
Skinner no lo respalda. 
b. n — 20 

62. 12.31 < (/x, - /x 2 ) < 14.69; /x, es mayor. 

64. H 0 . : 77 , = 7 r 2 ; Z = 0.423 esta entre ± 1 .96; no 
rechazar. 

66. -0.199 < (77, - 77 2 ) < 0.099 

68. a. -0.215 < (tt, - 77 2 ) < 0.315 
b. n — 1165 

70. Hq. tt w < 7r w ;Z = -0.908 esta entre +1.65; no 
rechazar. 

72. Hq. 77 c < 7r/, Z = 3,37 > 1.28; rechazar. 

74. H 0 : or] = er^ 

F = 1.46 < F 000579 - 6.88; no rechazar. 

Capitulo 10 

2. F = 20.69 > Fo 05 . 3.24 " 3.01; rechazar. 

4. F - 0,30 < 2.54; norechazar. 

6. F - 22.315 > 4.02; rechazar. 

T = 5.53; W Th T M F 

8. F = 4.84 > F 0055 ,o = 3.33; rechazar bloque. 

F = 9.37 > F 0 05 2 j 0 = 4.10; rechazar muestras. 

T = 1.33; solo 2 y 3 no difieren significativamente. 
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10. F = 10.10 > 9.78; rechazar bloque. 

F = 28.99 > 10.92; rechazar muestras. 

Solo 2 y 3 no difieren significativamente. 

12. F — 17.906 > 10.92; rechazar bloques. 

F = 0.17 < 9.78; no rechazar muestras. 

14. F — 11 > 3.49; rechazar muestras. 

16. F = 0.200 < 99; no rechazar. 

24. F = 5.52 < 3.55; rechazar. 

26. F = 1 .26 < 2.70; no rechazar. 

28. F — 3.83 < 3.89; no rechazar. 

30. F = 184.71 > 6.93; rechazar. 

32. F — 5.886 > 3.89; rechazar. 

34 f ~ 199.85 > 5.29; rechazar. 

36. F = 1 .537 < 2.70; no rechazar. 

38. F = 3.94; T = 2.35; DMS= 1.75 
40. DMS = 1.98; T = 2.41 

42. F ~ 4.75 > 3.26; rechazar bloques. 

F = 0.19 < 3.49; no rechazar muestras. 

44. F = 71.616 > 7.01; rechazar bloques. 

F = 1.025 < 8.65; no rechazar muestras. 

46. F = 38.56 > 18; rechazar bloques. 

F = 0.52 < 18; no rechazar muestras. 

Capi'tulo 11 

10. ft. C= 1.777 + 0.558/ 
c. US$15346.77 

12. b. C = 3.72 4- 0.1259(7 
c. US$4,664 

14. R = 0.138 + 0.5985; 4.324 
20. S e = 2.251 
22 . 5, = 0.617 
30. H 0 : /3, = 0 

t — 7.376 > * 0 . 0U0 = 3.169; rechazar la hipotesis 
nula; sf, es significante. 

32. H 0 : = 0 

t = 0.767 < / 0 05 9 = 2.262; no rechazar; no 
significativo. 

38. 0.666 < Y x ss 5.67 

40. a. US$8,095.68 

b. US$584 < < $15,606 

42. r 2 = .916 
44. 5.32 < 0, < 8.82 
46. -30.81 < < -19.89 

48. b x = 1 .6687; si, ft, > 0. 


50. // 0 : = 0; r = -1.461 entre ±3.169; no 

rechazar. 

// 0 : p = 0; t =1.461 entre ± 3.169; no rechazar 

52. a. /?= 68. 1 14 - 0.532 TR\ no, hay una relacion 
negativa entre B y TR. 

b. r 2 = 0.8167 

c. S e = 0.4825 

54. ft, = 3.39 > 0 
r = 0.896 > 0 

56. a. H 0 : = 0; f = 21.15 > Z = 1.65; rechazar H Q . 

b. H 0 : p — 0; los mismos resultados. 

58. 29.10 < At m= | 0 < 30.57 


Capi'tulo 12 

2. X l tiene un valor t bajo; no es significativo; considere 
retirarlo del modelo. 

4. Demuestra que a medida que aumenta P, la gente compra 
mas. Esto es improbable. 

6 . Con t crftica de ± 1 .96, / es significativa pero w no lo es. 

8 . a. 0:1 = 20.706 - 0.8531 + 0.11287P 4- 
0.001929 PR 

ft. Temperatura y Precio no lo son. 

c. Los valores p. 

d. Retirar precio 

e. R 2 = 95.8% 

10. La variable independiente no esta relacionada con la 
variable dependiente. 

12. H 0 : = 0; DR\ no rechazar si t esta entre ±2.052. 

Ambas son significativas. 

14. H 0 : ft, = 0; no rechazar si t esta entre ±3.25; I es 
significativa; r, no. 

22. Si X 2 - 1 cuando se presenta una huelga, ft 2 < 0. 

24. Se necesitan dos variables dummy ya que hay tres 
categories. 

28. Y = 78.12 + 1.01(17) - 17.2(0) = 95.29 enun 
distrito con una oficina. 

Y = 78.12 + 1.01(17) - 17.2(1) = 78.09 enun 
distrito sin una oficina. 

32. ft. T = -31276206 + 874097^ para el modelo lineal. 
r 2 = 78.9% 

T = - 9069460 + 172498/VB + 5297 NB 2 
R 2 = 79.3% 

34. Y = -39.6 + 0.144X, + 1.25X 2 + 0.683X 3 
(0.72) (2.53) (1.55) 

[0.487] [0.028] [0.149] 

los valores t estan entre () y los valores p estan entre []. 
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36. FIV, = 1.1; FIV, = 2.7 ; FIV 3 = 2.6 20. Jul 19.94 

38. R = 89 + 0.289 PC - 57.2 DISTANCIA A S° 2030 

(1.86) (-1.87) Se P 2131 

[0.096] [0.094] 22. a. 

los valores t estan entre () y los valores p estan entre []. 



Renta 

Pies cuadrados 

1995 

Renta 

1.000 

0.885 


PC 

0.885 

1.050 



FTV= 3.7 

42. US$114.40 mas. 

44. Y= -111 + 0.193 PC 4- 6.69 LUX . Este modelo 
es superior al primero que se baso en R 2 , S e \ y ambas 
variables son significativas. 

46. a. S= *22.3 4- 7.31E + 0.81S 

b. t — 0.26 < 2.447; norechazar fi s = 0. 

c. t — 16.32 > 2.447; rechazar p E = 0. 1996 

d. La prueba para AC no es concluyente. 

No hay evidencia de heterosedasticidad. 


Capitulo 13 


4. 


Dia 

3 

4 

5 

6 

7 

8 

9 

10 

Ausencias 

49.875 

46.625 

41.875 

41.875 

46.5 

49.875 

49.625 

48.5 


Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Die 

Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Die 


6. F x o - 214.152; CME= 124.57 (con a = 0.1) 

F 10 = 205.061; CME = 171.16 (con a = 0.8) 

8. 0= 88.714 » 4. 13 1 r; 0 Nov = 43.27; 0 Dic = 39.14 
10. I = 0.7203; II = 0.8344; III = 0.9443; IV = 1.5010 
12. I = 0.9045; II = 0.9334; III = 1.3881; IV = 0.7740 



Marzo 

Abril 

Mayo 

Junio 

Julio 

Azucar 

83.66 

96.24 

100 

98.53 

102.78 

Goma base 

56.65 

59.11 

100 

96.55 

90.64 

Maiz 

88.99 

95.41 

100 

105.50 

114.68 


16. L 96 = 73.3 
L 91 = 100 
L 98 = 108.10 

18. Ene = 0.8176 
Feb = 0.8694 
Mar = 0.9244 
Abr = 0.9977 
May = 1,0299 
Jun = 1.1926 


= 74.03 
P 91 = 100 
F 98 = 103.42 

Jul - 1.1383 
Ago = 1.2313 
Sep = 1.0278 
Oct = 0.8878 
Nov = 1.0090 
Die = 0.8702 


Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Die 


1995 Ene 
Feb 


Oct 19.49 
Nov 21.01 
Die 18.62 


Inventarios 


87.00 

93.00 
102.00 
112.00 

93.00 

82.00 
80.00 

73.00 

93.00 
102.00 

115.00 

112.00 

95.00 
102.00 
112.00 
115.00 

99.00 

90.00 

83.00 

79.00 

84.00 

89.00 

92.00 

91.00 


Inventarios 


0.9467 

1.0126 

1.1133 

1.1538 

1.0086 

0.9346 

0.8260 

0.7482 

0.9455 

1.0312 

1.1582 

1.1213 


Inventarios 


91.90 

91.84 


PM 

centrado 


95.67 

96.38 
97.17 
97.71 
98.08 

98.67 

99.13 
99.50 

99.38 
98.46 
96.96 

95.13 


PM 

centrado 


PM 

centrado 


( Continua) 
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Inventarios 

PM 

centrado 

Mar 


91.62 


Abr 


97.07 


May 


92.21 


Jun 


87.74 


Ju! 


96.85 


Ago 


97.56 


Sep 


98.37 


Oct 


98.91 


Nov 


99.29 


Die 


99.88 


1996 Ene 


100.35 


Feb 


100.73 


Mar 


100.60 


Abr 


99.67 


May 


98.15 


Jun 


96.30 


Jul 


100.48 


Ago 


105.58 


Sep 


88.85 


Oct 


86.31 


Nov 


79.43 


Die 


81.16 



Ene 

1.06 

Jul 

0.99 

Feb 

1.02 

Ago 

0.97 

Mar 

1.02 

Sep 

0.96 

Abr 

1.01 

Oct 

1.02 

May 

0.98 

Nov 

1.01 

Jun 

1.00 

Die 

0.98 

Una disminucion de US$320 cada mes. 


a . Los datos muestran variaciones segun las estaciones. 

h 





Deuda 

PM 

1 


14.1 


2 


13.7 


3 


12.1 


4 


13.1 


5 


13.5 


6 


9.1 


7 


7.2 

11.0208 

8 


6.1 

11.0833 

9 


8.7 

11.1458 

10 


10.1 

11.2250 

11 


11.8 

11.2792 

12 


12.2 

11.3167 

13 


15.2 

11.3333 

14 


14.1 

11.3500 

15 


13.2 

11.3833 

16 


13.9 

11,4583 



Deuda 

PM 

17 

14.0 

11.5333 

18 

9.5 

11.6000 

19 

7.2 

11.5875 

20 

6.5 

11.4583 

21 

9.1 

11.3333 

22 

11.5 

11.1958 

23 

12.2 

11.0750 

24 

13.4 

11.0000 

25 

13.7 

10.9292 

26 

12.5 

10.8708 

27 

11.8 

10.8125 

28 

12.0 

10.7042 

29 

13.0 

10.5792 

30 

8.7 

10.4583 

31 

6.3 


32 

6.0 


33 

8.2 


34 

9.8 


35 

10.9 


36 

11.8 



Indice estacional 


Ene 

1.2967 

Feb 

1.1955 

Mar 

1.1249 

Abr 

1.1665 

May 

1.2207 

Jun 

0.8250 

Jul 

0.6370 

Ago 

0.5585 

Sep 

0.7913 

Oct 

0.9630 

Nov 

1.0733 

Die 

1.1475 


d. 

1995 Ene 10.8738 

Feb 11.4599 

Mar 10.7566 

Abr 11.2304 

May 11.0590 

Jun 11.0303 

Jul 11.3028 

Ago 10.9213 

Sep 10.9939 

Oct 10.4883 

Nov 10.9938 

Die 10.6315 

1996 Ene 11.7221 

Feb 11.7945 

Mar 11.7345 


(Continua) 
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Abr 

11,9162 

May 

11.4686 

Jun 

11.5152 

Jul 

11.3028 

Ago 

11.6375 

Sep 

11.4994 

Oct 

11.9421 

Nov 

11.3665 

Die 

11.6772 

1997 Ene 

10.5654 

Feb 

10.4561 

Mar 

10.4899 

Abr 

10.2874 

May 

10.6494 

Jun 

10.5455 

Jul 

9.8900 

Ago 

10.7423 

Sep 

10.3621 

Oct 

10.1767 

Nov 

10.1553 

Die 

10.2829 


30, b . log Y = 1.29 + 0.0956? 

c. log Y = 1.29 + 0.0956 (13) = 2.5328 
Y = US$341.04 miles 



1996 

1997 

1998 

Carne 

100 

124.68 

125.64 

Leche 

100 

115.24 

119.52 

Polio 

100 

107.69 

108.72 

Pan 

100 

89.9 

113.13 

IP*, = 60.44 

1P 93 = 

100 


[P 9t = 69.27 

ip<>4 = 

111.38 


IP 92 = 86.93 

ip 95 = 

116.98 



IP 9 4 

ip 95 

ip 96 

Killer 

90.86 

109.14 

126.90 

Pyro 

75 

125 

149.75 

Maniac 

95.24 

104.76 

114.29 


38. F = 151.19 

42. El aumento de enero a febrero es 2.6%. 
El aumento de febrero a marzo es 2.9%. 
El aumento de marzo a abril es 3.6%. 

Capi'tulo 14 

2. X 2 - 0.72 < ^ 05.2 ~ 5.991 ; no rechazar. 
4. x 2 = 5.98 < 1 1 .348; no rechazar. 


6. H q : m = P\ P(x < 3) = 0.0287 < 0.05; rechazar. 

8. H 0 : m ~ P; P(x > =51 n = 8, 7 r = 0.5) = 

0.3639 > 0.05; no rechazar. 

10 . H 0 : fi F 2: fi m \ Z = -2.91 < -1.28; rechazar. 

12 . H 0 : jjl t = fi E \ Z = -2.43 < -1.96; rechazar. 

14 . Hq : p 5 = 0; r s = 0.809 > 0.6091; rechazar. 

16 . Hq. p s = 0; Z = 0.475 < - 1.96; rechazar. 

18. K = 4.24 < 5.991; no rechazar. 

20. K = 9.455 > 5.991; rechazar; C K = 6.92; 2 y 3 
no son significativamente diferentes. 

32 . Hq. el patron especifico existe; x 2 = 6.5 < 13.277; 
no rechazar. 

34 . H 0 : la distribucion es normal; x 2 = 8.33 < 9.488; 
no rechazar. 

36 . Hq. la distribucion es uniforme; X 2 = 35.677 > 13.277; 
rechazar. 

38 . H 0 : la distribucion es uniforme; x 2 = 3.77 < 15.086; 
no rechazar. 

40 . x 2 ” 86.661 > 16.9 19; rechazar. 

42 . x 2 = 1*602 < 9.488; no rechazar. 

44 . H 0 : distancia y preferencia son independientes. 

X 2 = 32.87 > 20.09; rechazar. 

46 . H 0 : tamano e importancia son independientes. 

X 2 — 29.61 > 7.779; rechazar. 

48 . H 0 : P < to; P(P ^ 7\n = 8, it = .5) = 0.0351 < 
0.05; rechazar. 

50. Hq. el uso es aleatorio; r- 8 rachas estan entre 4 y 14; 
no rechazar. 

52. H q : las ventas son aleatorias; 10 rachas no estan, entre 
13 y 26; rechazar la hipotesis nula y aumentar pubhcidad. 

54 . Hq. las ventas son aleatorias; z = -5.04 < - 1.96; 

rechazar la hipotesis nula y desplazarse a 200. 

56 . Hq. fj , j = jx 2 ; Z = 1.01 esta entre ±2.58; no rechazar. 

58 . Hq. /x, < p 2 ; Z = 2.40 > 1.65; rechazar. 

60 . H 0 : p, D S jj , m ; Z = 2.76 > 1.28; rechazar. 

62 . H 0 : las fallas son uniformes; x 2 — 1.17 < 11.345; 
no rechazar. 

64 . H 0 : la distribucion uniforme es preferencia; x 2 “ 4.40 < 

6.251; no rechazar. 

66. x 2 = 1*71 < 7.815; no rechazar. 

68. Hq. p s = 0; r s = 0.25 < 0.6786; no rechazar. 

70. H 0 : las calificaciones son independientes; z = 5.9 

> 1.65; rechazar. 

72 . H 0 : las calificaciones son independientes;! = - 1 .83 

> -2.58; no rechazar. 
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Capftulo 15 

2. LSC x = 19.567 
LIC * = 10.533 
LSC R = 14.148 
LIC , — 0 

4. LSC x = 12.1 1 
LIC * = 5.082 
LSC R = 20.26 
LIC * = 2.54 

6. LSC = 0.2278 
LIC = 0.0756 

8. LSC = 12.57 
LIC - -1.53 o 0 

10. LSC = 10.58 

LIC = - 1.911 o 0 

14. LSC R — 58.31 
LIC R = 0 

16. LSC* = 12.056 
LIC * = 0 

18. LSC , = 29.46 
LIC R = 0 

20. LSC , = 9.99 
LIC , = 2.61 
LSC x = 29.58 
LIC * = 27.32 

22. LSC x ~ US $386.74 
LIC x = US$370.46 
LSC * = US$52.52 
LIC * = US$8.69 

24. 7r = NCA= 0.05 

Riesgo del productor = 0.20 
n = 50 
c - 4 

26. El embarque sera aceptado si la cantidad de defectos no 
supera a 4. 

28. 7r = NC A = 0.05 

Riesgo del productor = 0.10 
n = 50 
c = 5 


30. LSC ^ - 48.341 
LIC % — 35.66 
LSC, = 31.69 
LIC R = 2.31 

32. LSC, = 0.524 
LIC , = 0 

34. Para Word Perfect: 

LSC, = 0.48; uCp = 0.098 
LSC c = 25.9; LIC t = 3.07 
Para Professional Write: 

LSC, = 0.10 
LIC , = 0 
LSC c = 0.55 
LIC c = 0 

36. LSC, = 0.66 
LIC, = 0.12 

38. tt = 0.01 ; riesgo del productor = 0.05; 

n = 20; c = 1 <5; si, debe volver a trabajar todo el 
lote 

40. LSC x = US$47.87 
LIC x = US$42.37 
LSC, = US$20.39 
LIC , = US$4.29 

42. LSC x = 7.6 
LIC y = 6.4 
LSC, = 5.9 
LIC, = 1.7 

44. NCA = 0.05; a = 0.1; n = 20 
c — 7 > 2; destruir el lote. 

46. LSC, = 0.53 
LIC, = 0.13 

48. 7 r = 0.05; riesgo del productor = 0.15; 
n ~ 100; C = 7 < 12 reimprimir el lote. 

50. LSC* = 43.1 
LIC x = 23.1 
LSC, = 28.6 
LIC R = 3.63 




Tablas 

estadfsticas 


APENDICE III • Tablas estadisticas gg 1 


Lista de tablas estadisticas 

A. Numeros aleatorios 

B . Distribution binomial 

C. Distribucion binomial acumulada 

D. Distribution de Poisson 

E. Distribucion normal 

F. Distribution t 

G. Distribucion F 

H. Distribucion chi-cuadrado 

I. Logaritmos comunes 

J. Alfabeto griego 

K. Estadistico de Durbin- Watson 

L . Valores crfticos de la distribucion de rangos de Student 

M. Valores crfticos de r en la prueba de rachas 

N. Correlation de rangos de Spearman, areas combinadas en ambas colas. 

O. Factores crfticos para las cartas de control 

P. Combinatorios 
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Tabla A Numeros aleatorios 



00-04 

05-09 

10-14 

15-19 

20-24 

25-29 

30-34 

35-39 

40-44 

45-49 

00 

49317 

61129 

89131 

29072 

80328 

28430 

78219 

60095 

04875 

30641 

01 

07046 

86793 

60292 

56275 

32920 

27352 

55677 

34884 

87794 

22116 

02 

56428 

89199 

96669 

95523 

00874 

01737 

08316 

00882 

56108 

34900 

03 

68900 

32909 

98886 

85352 

20112 

46277 

62505 

69155 

07346 

92641 

04 

65662 

92876 

33167 

85630 

60153 

25658 

04163 

81487 

59085 

33576 

05 

30626 

89793 

89030 

39186 

62672 

34096 

79259 

15484 

82961 

86128 

06 

08944 

92260 

71141 

63269 

05390 

42740 

02812 

98612 

58029 

78535 

07 

53490 

30321 

64325 

57140 

95602 

92005 

05120 

24503 

74878 

21816 

08 

33484 

23794 

22548 

16752 

78833 

64716 

14800 

69177 

26377 

02784 

09 

16467 

95532 

29912 

12393 

74101 

24446 

45482 

55675 

59413 

91906 

10 

35648 

85681 

27823 

00756 

75951 

51803 

04182 

35073 

89864 

78820 

11 

73724 

25186 

66154 

26528 

02112 

53109 

15320 

44726 

02152 

14321 

12 

61085 

53289 

05080 

77312 

79142 

58556 

45233 

37393 

60769 

37304 

13 

23284 

89012 

94167 

81623 

59675 

85151 

78454 

84486 

31295 

94858 

14 

81334 

97145 

27866 

93469 

02050 

99518 

30914 

79136 

89952 

51563 

15 

70229 

95039 

36517 

04863 

14328 

71347 

16221 

92383 

90054 

08118 

16 

84379 

45707 

36649 

43629 

61046 

93738 

36678 

57640 

90478 

50696 

17 

91202 

42142 

73277 

70202 

61335 

18636 

27563 

02650 

45680 

24077 

18 

69071 

10757 

67521 

59631 

22410 

24987 

37794 

12790 

97416 

19615 

19 

42822 

63339 

34940 

43796 

83207 

39270 

98714 

70333 

82408 

52589 

20 

86633 

11146 

47855 

13344 

43564 

53166 

42681 

00803 

37026 

44351 

21 

61596 

11753 

08231 

18109 

94006 

35433 

01043 

39224 

38726 

13111 

22 

86215 

20972 

18304 

21153 

17059 

12093 

69457 

56257 

84432 

05259 

23 

98688 

73108 

70887 

75456 

83201 

93243 

38804 

66203 

59053 

90063 

24 

32796 

91274 

53344 

24202 

18083 

07536 

04096 

55453 

15316 

11471 

25 

15977 

05506 

18654 

22614 

91478 

64332 

51332 

63110 

76297 

19613 

26 

17925 

59081 

74018 

14369 

24886 

19808 

61363 

19310 

58818 

99851 

27 

67049 

15491 

35555 

35341 

35698 

97895 

39569 

07110 

49428 

50891 

28 

75900 

74079 

27038 

77422 

29686 

24769 

88667 

16058 

21021 

04819 

29 

48659 

92532 

93316 

11508 

82066 

12347 

35076 

23829 

11305 

48093 

30 

23159 

60432 

40676 

89822 

36698 

69157 

38945 

01148 

44429 

78018 

31 

37587 

46602 

28947 

12981 

14217 

76012 

04095 

04679 

23535 

31867 

32 

09754 

64860 

72470 

18049 

67372 

37792 

85406 

05552 

06024 

27259 

33 

89173 

97364 

23088 

43273 

31372 

23748 

50282 

89728 

03484 

80002 

34 

34997 

55750 

50195 

60033 

87970 

94694 

98383 

47484 

77607 

53880 

35 

68498 

33841 

10761 

73957 

29175 

19068 

76619 

60242 

12495 

44883 

36 

99127 

03990 

54471 

01563 

50411 

63460 

85032 

53959 

74689 

78264 

37 

44161 

42863 

30138 

21892 

91664 

93233 

07974 

44475 

52732 

21112 

38 

15269 

95676 

29448 

72868 

62829 

44748 

67316 

21874 

31629 

92205 

39 

98973 

40380 

26128 

53541 

02008 

12446 

44222 

22946 

05278 

12020 
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Tabla A Numeros aleatorios (continuacion) 



50-54 

55-59 

60-64 

65-69 

70-74 

75-79 

80-84 

85-89 

90-94 

95-99 

00 

03424 

74864 

11746 

77342 

24970 

15430 

76369 

08232 

05402 

66087 

01 

01677 

84988 

35246 

15095 

08838 

31175 

20982 

30309 

18096 

84899 

02 

57939 

08859 

48441 

57896 

84319 

83283 

14811 

97076 

89291 

35910 

03 

27552 

57307 

58843 

38377 

02136 

59389 

82338 

26309 

28637 

68452 

04 

97565 

86873 

98942 

00360 

64645 

46932 

71799 

09485 

09314 

51819 

05 

84800 

50323 

33396 

46177 

09149 

02865 

00588 

46994 

99550 

40506 

06 

52914 

13681 

23381 

38797 

28428 

48170 

03086 

32809 

75236 

00058 

07 

54951 

66790 

09596 

29427 

05105 

92584 

45968 

12386 

07806 

40655 

08 

80362 

43955 

61191 

47628 

11426 

99325 

69607 

28305 

73922 

89271 

09 

62421 

70476 

37258 

31697 

61109 

18333 

91701 

95563 

46201 

12514 

10 

33012 

34971 

29595 

09899 

95259 

51098 

16799 

89517 

09909 

48352 

11 

93937 

10140 

85341 

57364 

65055 

85239 

68144 

72578 

85758 

20926 

12 

47343 

53008 

64554 

77142 

54813 

94272 

13220 

93276 

12028 

05842 

13 

36728 

89534 

32162 

58174 

07438 

49352 

68648 

65773 

47769 

73026 

14 

54192 

52552 

94695 

93188 

69058 

53322 

86416 

18973 

95293 

10967 

15 

73243 

63347 

17348 

17122 

59731 

57994 

34753 

97620 

20537 

42766 

16 

38748 

95561 

20099 

98539 

36899 

30760 

28145 

60312 

83863 

96312 

17 

95047 

14426 

44302 

54731 

18933 

19080 

72952 

57627 

56855 

34859 

18 

77174 

73993 

06339 

33863 

27247 

70802 

72386 

35801 

43204 

07923 

19 

75687 

63671 

09641 

21688 

19629 

77186 

34847 

76911 

77754 

74082 

20 

65318 

93663 

57336 

82518 

72106 

38375 

45361 

17294 

32214 

77321 

21 

39689 

65062 

26294 

06957 

28051 

32978 

04044 

19522 

00154 

07399 

22 

86917 

30252 

02536 

28503 

08677 

89051 

37121 

30540 

24812 

33251 

23 

87081 

02290 

11567 

64665 

52242 

44974 

06450 

82159 

86458 

35857 

24 

20029 

12125 

22239 

70058 

66242 

78416 

53416 

76656 

37235 

37497 

25 

41343 

01619 

68185 

65843 

30455 

16122 

43529 

99837 

08684 

56947 

26 

48802 

86690 

70360 

61800 

96292 

54364 

27178 

39817 

58175 

64075 

27 

00201 

53674 

62822 

14069 

80581 

45643 

92836 

46278 

82670 

37519 

28 

96157 

13631 

45042 

85158 

13973 

67170 

14192 

72897 

13882 

68487 

29 

66903 

83523 

64279 

09547 

78335 

40315 

74289 

05578 

98707 

68894 

30 

77037 

12096 

69134 

13504 

00181 

31991 

79227 

67942 

70880 

37872 

31 

07666 

49845 

86053 

94798 

83079 

50421 

68467 

76689 

02028 

55555 

32 

60628 

11373 

54477 

41349 

96997 

02999 

16166 

57749 

13288 

05359 

33 

08193 

10440 

76553 

44186 

83076 

05119 

31491 

82985 

61346 

08473 

34 

64368 

14947 

82460 

06619 

79026 

51058 

65457 

59765 

09322 

71875 

35 

17654 

34052 

30839 

63725 

84414 

76157 

74516 

53829 

88846 

77860 

36 

73333 

12388 

33682 

35931 

08861 

84952 

54744 

06407 

28523 

22183 

37 

71375 

07499 

20422 

92949 

04918 

90317 

23064 

83117 

82547 

17584 

38 

46163 

11272 

64918 

50711 

54539 

23970 

17133 

55776 

16550 

91313 

39 

49910 

95947 

81477 

20980 

47258 

33546 

64109 

68526 

73100 

49610 
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Tabla B Distribution binomial 


n 


77 

X 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

1 

0 

0.9500 

0.9000 

0.8500 

0.8000 

0.7500 

0.7000 

0.6500 

0.6000 

0.5500 

0.5000 


1 

0.0500 

0.1000 

0.1500 

0.2000 

0.2500 

0.3000 

0.3500 

0.4000 

0.4500 

0.5000 

2 

0 

0.9025 

0.8100 

0.7225 

0.6400 

0.5625 

0.4900 

0.4225 

0.3600 

0.3025 

0.2500 


1 

0.0950 

0.1800 

0.2550 

0.3200 

0.3750 

0.4200 

0.4550 

0.4800 

0.4950 

0.5000 


2 

0.0025 

0.0100 

0.0225 

0.0400 

0.0625 

0.0900 

0.1225 

0,1600 

0.2025 

0.2500 

3 

0 

0.8574 

0.7290 

0.6141 

0.5120 

0.4219 

0.3430 

0.2746 

0.2160 

0,1664 

0.1250 


1 

0.1354 

0.2430 

0.3251 

0.3840 

0.4219 

0.4410 

0.4436 

0.4320 

0.4084 

0.3750 


2 

0.0071 

0.0270 

0.0574 

0.0960 

0.1406 

0.1890 

0.2389 

0.2880 

0.3341 

0.3750 


3 

0.0001 

0.0010 

0.0034 

0.0080 

0.0156 

0.0270 

0.0429 

0.0640 

0.0911 

0.1250 

4 

0 

0.8145 

0.6561 

0.5220 

0.4096 

0.3164 

0.2401 

0.1785 

0.1296 

0.0915 

0.0625 


1 

0.1715 

0.2916 

0.3685 

0.4096 

0.4219 

0.4116 

0.3845 

0.3456 

0.2995 

0.2500 


2 

0.0135 

0.0486 

0.0975 

0.1536 

0.2109 

0.2646 

0.3105 

0.3456 

0.3675 

0.3750 


3 

0.0005 

0.0036 

0.0115 

0.0256 

0.0469 

0.0756 

0.1115 

0.1536 

0.2005 

0.2500 


4 

0.0000 

0.0001 

0.0005 

0.0016 

0.0039 

0.0081 

0.0150 

0.0256 

0.0410 

0.0625 

5 

0 

0.7738 

0.5905 

0.4437 

0.3277 

0.2373 

0.1681 

0.1160 

0.0778 

0.0503 

0.0313 


1 

0.2036 

0.3281 

0.3915 

0.4096 

0.3955 

0.3602 

0,3124 

0.2592 

0.2059 

0.1563 


2 

0.0214 

0.0729 

0.1382 

0.2048 

0.2637 

0.3087 

0.3364 

0.3456 

0.3369 

0.3125 


3 

0.0011 

0.0081 

0.0244 

0.0512 

0.0879 

0.1323 

0.1811 

0.2304 

0.2757 

0.3125 


4 

0.0000 

0.0005 

0.0022 

0.0064 

0.0146 

0.0284 

0.0488 

0.0768 

0.1128 

0.1563 


5 

0.0000 

0.0000 

0.0001 

0.0003 

0.0010 

0.0024 

0.0053 

0.0102 

0.0185 

0.0313 

6 

0 

0.7351 

0.5314 

0.3771 

0.2621 

0.1780 

0.1176 

0.0754 

0.0467 

0.0277 

0.0156 


1 

0.2321 

0.3543 

0.3993 

0.3932 

0.3560 

0.3025 

0.2437 

0.1866 

0.1359 

0.0938 


2 

0.0305 

0.0984 

0.1762 

0.2458 

0.2966 

0.3241 

0.3280 

0.3110 

0.2780 

0.2344 


3 

0.0021 

0.0146 

0.0415 

0.0819 

0.1318 

0.1852 

0.2355 

0.2765 

0.3032 

0.3125 


4 

0.0001 

0.0012 

0.0055 

0.0154 

0.0330 

0.0595 

0.0951 

0.1382 

0.1861 

0.2344 


5 

0.0000 

0.0001 

0.0004 

0.0015 

0.0044 

0.0102 

0.0205 

0.0369 

0.0609 

0.0938 


6 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0007 

0.0018 

0.0041 

0.0083 

0.0156 

7 

0 

0.6983 

0.4783 

0.3206 

0.2097 

0.1335 

0.0824 

0.0490 

0.0280 

0.0152 

0.0078 


1 

0.2573 

0.3720 

0.3960 

0.3670 

0.3115 

0.2471 

0.1848 

0.1306 

0.0872 

0.0547 


2 

0.0406 

0.1240 

0.2097 

0.2753 

0.3115 

0.3177 

0.2985 

0.2613 

0,2140 

0.1641 


3 

0.0036 

0.0230 

0.0617 

0.1147 

0.1730 

0.2269 

0.2679 

0.2903 

0.2918 

0.2734 


4 

0.0002 

0.0026 

0.0109 

0.0287 

0.0577 

0.0972 

0.1442 

0.1935 

0.2388 

0.2734 


5 

0.0000 

0.0002 

0.0012 

0.0043 

0.0115 

0.0250 

0.0466 

0.0774 

0.1172 

0.1641 


6 

0.0000 

0.0000 

0.0001 

0.0004 

0.0013 

0.0036 

0.0084 

0.0172 

0.0320 

0.0547 


7 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0006 

0.0016 

0.0037 

0.0078 

8 

0 

0.6634 

0.4305 

0.2725 

0.1678 

0.1001 

0.0576 

0.0319 

0.0168 

0.0084 

0.0039 


1 

0.2793 

0.3826 

0.3847 

0.3355 

0.2670 

0.1977 

0.1373 

0.0896 

0.0548 

0.0313 


2 

0.0515 

0.1488 

0.2376 

0.2936 

0.3115 

0.2965 

0.2587 

0.2090 

0.1569 

0.1094 


3 

0.0054 

0.0331 

0.0839 

0.1468 

0.2076 

0.2541 

0.2786 

0.2787 

0.2568 

0.2188 


4 

0.0004 

0.0046 

0.0185 

0.0459 

0.0865 

0.1361 

0.1875 

0.2322 

0.2627 

0.2734 


5 

0.0000 

0.0004 

0.0026 

0.0092 

0.0231 

0.0467 

0.0808 

0.1239 

0.1719 

0.2188 


6 

0.0000 

0.0000 

0.0002 

0.0011 

0.0038 

0.0100 

0.0217 

0.0413 

0.0703 

0.1094 


7 

0.0000 

0.0000 

0.0000 

o.ooot 

0.0004 

0.0012 

0.0033 

0.0079 

0.0164 

0.0313 


8 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0007 

0.0017 

0.0039 

9 

0 

0.6302 

0.3874 

0.2316 

0.1342 

0.0751 

0.0404 

0.0207 

0.0101 

0.0046 

0.0020 


1 

0.2985 

0.3874 

0.3679 

0.3020 

0.2253 

0.1556 

0.1004 

0.0605 

0.0339 

0.0176 
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Tabla B Distribucion binomial (continuacion) 


7T 


X 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

2 

0.0629 

0.1722 

0.2597 

0.3020 

0.3003 

0.2668 

0.2162 

0.1612 

0.1110 

0.0703 

3 1 

0.0077 

0.0446 

0.1069 

0.1762 

0.2336 

0.2668 

0.2716 

0.2508 

0.2119 

0.1641 

4 

0.0006 

0.0074 

0.0283 

0.0661 

0.1168 

0.1715 

0.2194 

0.2508 

0.2600 

0.2461 

5 

0.0000 

0.0008 

0.0050 

0.0165 

0.0389 

0.0735 

0.1181 

0.1672 

0.2128 

0.2461 

6 

0.0000 

0.0001 

0.0006 

0.0028 

0.0087 

0.0210 

0.0424 

0.0743 

0.1160 

0.1641 

7 

0.0000 

0.0000 

0.0000 

0.0003 

0.0012 

0.0039 

0.0098 

0.0212 

0.0407 

0.0703 

8 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0013 

0.0035 

0.0083 

0.0176 

9 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0008 

0.0020 

0 

0.5987 

0.3487 

0.1969 

0.1074 

0.0563 

0.0282 

0.0135 

0.0060 

0.0025 

0.0010 

1 

0.3151 

0.3874 

0.3474 

0.2684 

0.1877 

0.1211 

0.0725 

0.0403 

0.0207 

0.0098 

2 

0.0746 

0.1937 

0.2759 

0.3020 

0.2816 

0.2335 

0.1757 

0.1209 

0.0763 

0.0439 

3 

0.0105 

0.0574 

0.1298 

0.2013 

0.2503 

0.2668 

0.2522 

0.2150 

0.1665 

0.1172 

4 

0.0010 

0.0112 

0.0401 

0.0881 

0.1460 

0.2001 

0.2377 

0.2508 

0.2384 

0.2051 

5 

0.0001 

0.0015 

0.0085 

0.0264 

0.0584 

0.1029 

0.1536 

0.2007 

0.2340 

0.2461 

6 

0.0000 

0.0001 

0.0012 

0.0055 

0.0162 

0.0368 

0.0689 

0.1115 

0.1596 

0.2051 

7 

0.0000 

0.0000 

0.0001 

0.0008 

0.0031 

0.0090 

0.0212 

0.0425 

0.0746 

0.1172 

8 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0014 

0.0043 

0.0106 

0.0229 

0.0439 

9 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0016 

0.0042 

0.0098 

10 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0010 

0 

0.5688 

0.3138 

0.1673 

0.0859 

0.0422 

0.0198 

0.0088 

0.0036 

0.0014 

0.0005 

1 

0.3293 

0.3835 

0.3248 

0.2362 

0.1549 

0.0932 

0.0518 

0.0266 

0.0125 

0.0054 

2 

0.0867 

0.2131 

0.2866 

0.2953 

0.2581 

0.1998 

0.1395 

0.0887 

0.0513 

0.0269 

3 

0.0137 

0.0710 

0.1517 

0.2215 

0.2581 

0.2568 

0.2254 

0.1774 

0.1259 

0.0806 

4 

0.0014 

0.0158 

0.0536 

0.1107 

0.1721 

0.2201 

0.2428 

0.2365 

0.2060 

0.1611 

5 

0.0001 

0.0025 

0.0132 

0.0388 

0.0803 

0.1321 

0.1830 

0.2207 

0.2360 

0.2256 

6 

0.0000 

0.0003 

0.0023 

0.0097 

0.0268 

0.0566 

0.0985 

0.1471 

0.1931 

0.2256 

7 

0.0000 

0.0000 

0.0003 

0.0017 

0.0064 

0.0173 

0.0379 

0.0701 

0.1128 

0.1611 

8 

0.0000 

0.0000 

0.0000 

0.0002 

0.0011 

0.0037 

0.0102 

0.0234 

0.0462 

0.0806 

9 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0018 

0.0052 

0.0126 

0.0269 

10 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0007 

0.0021 

0.0054 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0005 

0 

0.5404 

0.2824 

0.1422 

0.0687 

0.0317 

0.0138 

0.0057 

0.0022 

0.0008 

0.0002 

1 

0.3413 

0.3766 

0.3012 

0.2062 

0.1267 

0.0712 

0.0368 

0.0174 

0.0075 

0.0029 

2 

0.0988 

0.2301 

0.2924 

0.2835 

0.2323 

0.1678 

0.1088 

0.0639 

0.0339 

0.0161 

3 

0.0173 

0.0852 

0.1720 

0.2362 

0.2581 

0.2397 

0.1954 

0.1419 

0.0923 

0.0537 

4 

0.0021 

0.0213 

0.0683 

0.1329 

0.1936 

0.2311 

0.2367 

0.2128 

0.1700 

0.1208 

5 

0.0002 

0.0038 

0.0193 

0.0532 

0.1032 

0.1585 

0.2039 

0.2270 

0.2225 

0.1934 

6 

0.0000 

0.0005 

0.0040 

0.0155 

0.0401 

0.0792 

0.1281 

0.1766 

0.2124 

0.2256 

7 

0.0000 

0.0000 

0.0006 

0.0033 

0.0115 

0.0291 

0.0591 

0.1009 

0.1489 

0.1934 

8 

0.0000 

0.0000 

0.0001 

0.0005 

0.0024 

0.0078 

0.0199 

0.0420 

0.0762 

0.1208 

9 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0015 

0.0048 

0.0125 

0.0277 

0.0537 

10 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0008 

0.0025 

0.0068 

0.0161 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0010 

0.0029 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0 

0.5133 

0.2542 

0.1209 

0.0550 

0.0238 

0.0097 

0.0037 

0.0013 

0.0004 

0.0001 

1 

0.3512 

0.3672 

0.2774 

0.1787 

0.1029 

0.0540 

0.0259 

0.0113 

0,0045 

0.0016 
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Tabla B Distribueion binomial (eontinuacion) 


X 

TS 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

2 

0.1109 

0.2448 

0.2937 

0.2680 

0.2059 

0.1388 

0.0836 

0.0453 

0.0220 

0.0095 

3 

0.0214 

0.0997 

0.1900 

0.2457 

0.2517 

0.2181 

0.1651 

0.1107 

0.0660 

0.0349 

4 

0.0028 

0.0277 

0.0838 

0.1535 

0.2097 

0.2337 

0.2222 

0.1845 

0.1350 

0.0873 

5 

0.0003 

0.0055 

0.0266 

0.0691 

0.1258 

0.1803 

0.2154 

0.2214 

0.1989 

0.1571 

6 

0.0000 

0.0008 

0.0063 

0.0230 

0.0559 

0.1030 

0.1546 

0.1968 

0.2169 

0.2095 

7 

0.0000 

0.0001 

0.0011 

0.0058 

0.0186 

0.0442 

0.0833 

0.1312 

0.1775 

0.2095 

8 

0.0000 

0.0000 

0.0001 

0.0011 

0.0047 

0.0142 

0.0336 

0.0656 

0.1089 

0.1571 

9 

0.0000 

0.0000 

0.0000 

0.0001 

0.0009 

0.0034 

0.0101 

0.0243 

0.0495 

0.0873 

10 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

0.0022 

0.0065 

0.0162 

0.0349 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0012 

0.0036 

0.0095 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0016 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0 

0.4877 

0.2288 

0.1028 

0.0440 

0.0178 

0.0068 

0.0024 

0.0008 

0.0002 

0.0001 

1 

0.3593 

0.3559 

0.2539 

0.1539 

0.0832 

0.0407 

0.0181 

0.0073 

0.0027 

0.0009 

2 

0.1229 

0.2570 

0.2912 

0.2501 

0.1802 

0.1134 

0.0634 

0.0317 

0.0141 

0.0056 

3 

0.0259 

0.1142 

0.2056 

0.2501 

0.2402 

0.1943 

0.1366 

0.0845 

0.0462 

0.0222 

4 

0.0037 

0.0349 

0.0998 

0.1720 

0.2202 

0.2290 

0.2022 

0.1549 

0.1040 

0.0611 

5 

0.0004 

0.0078 

0.0352 

0.0860 

0.1468 

0.1963 

0.2178 

0.2066 

0.1701 

0.1222 

6 

0.0000 

0.0013 

0.0093 

0.0322 

0.0734 

0.1262 

0.1759 

0.2066 

0.2088 

0.1833 

7 

0.0000 

0.0002 

0.0019 

0.0092 

0.0280 

0.0618 

0.1082 

0.1574 

0.1952 

0.2095 

8 

0.0000 

0.0000 

0.0003 

0.0020 

0.0082 

0.0232 

0.0510 

0.0918 

0.1398 

0.1833 

9 

0.0000 

0.0000 

0.0000 

0.0003 

0.0018 

0.0066 

0.0183 

0.0408 

0.0762 

0.1222 

10 

0.0000 

0.0000 

0.0000 

0.0000 

0.0003 

0.0014 

0.0049 

0.0136 

0.0312 

0.0611 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0010 

0.0033 

0.0093 

0.0222 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0019 

0.0056 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0009 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0 

0.4633 

0.2059 

0.0874 

0.0352 

0.0134 

0.0047 

0.0016 

0.0005 

0.0001 

0.0000 

1 

0.3658 

0.3432 

0.2312 

0.1319 

0.0668 

0.0305 

0.0126 

0.0047 

0.0016 

0.0005 

2 

0.1348 

0.2669 

0.2856 

0.2309 

0.1559 

0.0916 

0.0476 

0.0219 

0.0090 

0.0032 

3 

0.0307 

0.1285 

0.2184 

0.2501 

0.2252 

0.1700 

0.1110 

0.0634 

0.0318 

0.0139 

4 

0.0049 

0.0428 

0.1156 

0.1876 

0.2252 

0.2186 

0.1792 

0.1268 

0.0780 

0.0417 

5 

0.0006 

0.0105 

0.0449 

0.1032 

0.1651 

0.2061 

0.2123 

0.1859 

0.1404 

0.0916 

6 

0.0000 

0.0019 

0.0132 

0.0430 

0.0917 

0.1472 

0.1906 

0.2066 

0.1914 

0.1527 

7 

0.0000 

0.0003 

0.0030 

0.0138 

0.0393 

0.0811 

0.1319 

0.1771 

0.2013 

0.1964 

8 

0.0000 

0.0000 

0.0005 

0.0035 

0.0131 

0.0348 

0.0710 

0.1181 

0.1647 

0.1964 

9 

0.0000 

0.0000 

0.0001 

0.0007 

0.0034 

0.0116 

0.0298 

0.0612 

0.1048 

0.1527 

10 

0.0000 

0.0000 

0.0000 

0.0001 

0.0007 

0.0030 

0.0096 

0.0245 

0.0515 

0.0916 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

0.0024 

0.0074 

0.0191 

0.0417 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0016 

0.0052 

0.0139 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0010 

0.0032 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0 

0.4401 

0.1853 

0.0743 

0.0281 

0.0100 

0.0033 

0.0010 

0.0003 

0.0001 

0.0000 

1 

0.3706 

0.3294 

0.2097 

0.1126 

0.0535 

0.0228 

0.0087 

0.0030 

0.0009 

0.0002 

2 

0.1463 

0.2745 

0.2775 

0.2111 

0.1336 

0.0732 

0.0353 

0.0150 

0.0056 

0.0018 
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Tabla B Distribucion binomial (continuation) 


X 

7T 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

3 

0.0359 

0.1423 

0.2285 

0.2463 

0.2079 

0.1465 

0.0888 

0.0468 

0.0215 

0.0085 

4 

0.0061 

0.0514 

0.1311 

0.2001 

0.2252 

0.2040 

0.1553 

0.1014 

0.0572 

0.0278 

5 

0.0008 

0.0137 

0.0555 

0.1201 

0.1802 

0.2099 

0.2008 

0.1623 

0.1123 

0.0667 

6 

0.0001 

0.0028 

0.0180 

0.0550 

0.1101 

0.1649 

0.1982 

0.1983 

0.1684 

0.1222 

7 

0.0000 

0.0004 

0.0045 

0.0197 

0.0524 

0,1010 

0.1524 

0.1889 

0.1969 

0.1746 

8 

0.0000 

0.0001 

0.0009 

0.0055 

0.0197 

0.0487 

0.0923 

0.1417 

0.1812 

0.1964 

9 

0.0000 

0.0000 

0.0001 

0.0012 

0.0058 

0.0185 

0.0442 

0.0840 

0.1318 

0.1746 

10 

0.0000 

0.0000 

0.0000 

0.0002 

0.0014 

0.0056 

0.0167 

0.0392 

0.0755 

0.1222 

11 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0013 

0.0049 

0.0142 

0.0337 

0.0667 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0011 

0.0040 

0.0115 

0.0278 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0008 

0.0029 

0.0085 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0018 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0,0000 

0,0001 

0.0002 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0 

0.4181 

0.1668 

0.0631 

0.0225 

0.0075 

0.0023 

0.0007 

0.0002 

0.0000 

0.0000 

1 

0.3741 

0.3150 

0.1893 

0.0957 

0.0426 

0.0169 

0.0060 

0.0019 

0.0005 

0.0001 

2 

0.1575 

0.2800 

0.2673 

0.1914 

0.1136 

0.0581 

0.0260 

0.0102 

0.0035 

0.0010 

3 

0.0415 

0.1556 

0.2359 

0.2393 

0.1893 

0.1245 

0.0701 

0.0341 

0.0144 

0.0052 

4 

0.0076 

0.0605 

0.1457 

0.2093 

0.2209 

0.1868 

0.1320 

0.0796 

0.0411 

0.0182 

5 

0.0010 

0.0175 

0.0668 

0.1361 

0.1914 

0.2081 

0.1849 

0.1379 

0.0875 

0.0472 

6 

0.0001 

0.0039 

0.0236 

0.0680 

0.1276 

0.1784 

0.1991 

0.1839 

0.1432 

0.0944 

7 

0.0000 

0.0007 

0.0065 

0.0267 

0.0668 

0.1201 

0.1685 

0.1927 

0.1841 

0.1484 

8 

0.0000 

0.0001 

0.0014 

0.0084 

0.0279 

0.0644 

0.1134 

0.1606 

0.1883 

0.1855 

9 

0.0000 

0.0000 

0.0003 

0.0021 

0.0093 

0.0276 

0.0611 

0.1070 

0.1540 

0.1855 

10 

0.0000 

0.0000 

0.0000 

0.0004 

0.0025 

0.0095 

0.0263 

0.0571 

0.1008 

0.1484 

11 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0026 

0.0090 

0.0242 

0.0525 

0.0944 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

0.0024 

0.0081 

0.0215 

0.0472 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0021 

0.0068 

0.0182 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0016 

0.0052 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

0.0010 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0 

0.3972 

0.1501 

0.0536 

0.0180 

0.0056 

0.0016 

0.0004 

0.0001 

0,0000 

0.0000 

1 

0.3763 

0.3002 

0.1704 

0.0811 

0.0338 

0.0126 

0.0042 

0.0012 

0.0003 

0.0001 

2 

0.1683 

0.2835 

0.2556 

0.1723 

0.0958 

0.0458 

0.0190 

0.0069 

0.0022 

0.0006 

3 

0.0473 

0.1680 

0.2406 

0.2297 

0.1704 

0.1046 

0.0547 

0.0246 

0.0095 

0.0031 

4 

0.0093 

0.0700 

0.1592 

0.2153 

0.2130 

0.1681 

0.1104 

0.0614 

0.0291 

0.0117 

5 

0.0014 

0.0218 

0.0787 

0.1507 

0.1988 

0.2017 

0.1664 

0.1146 

0.0666 

0.0327 

6 

0.0002 

0.0052 

0.0301 

0.0816 

0.1436 

0.1873 

0.1941 

0.1655 

0.1181 

0.0708 

7 

0.0000 

0.0010 

0.0091 

0.0350 

0.0820 

0.1376 

0.1792 

0.1892 

0.1657 

0.1214 

8 

0.0000 

0.0002 

0.0022 

0.0120 

0.0376 

0.0811 

0.1327 

0.1734 

0.1864 

0.1669 

9 

0.0000 

0.0000 

0.0004 

0.0033 

0.0139 

0.0386 

0.0794 

0.1284 

0.1694 

0.1855 

10 

0.0000 

0.0000 

0.0001 

0.0008 

0.0042 

0.0149 

0.0385 

0.0771 

0.1248 

0.1669 

11 

0.0000 

0.0000 

0.0000 

0.0001 

0.0010 

0,0046 

0.0151 

0.0374 

0.0742 

0.1214 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0012 

0.0047 

0.0145 

0.0354 

0.0708 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0,0002 

0.0012 

0.0045 

0.0134 

0.0327 
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Tabla B Distribution binomial (continuation) 


X 

7T 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0011 

0.0039 

0.0117 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0009 

0.0031 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0,0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

18 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0 

0.3774 

0.1351 

0.0456 

0.0144 

0.0042 

0.0011 

0.0003 

0.0001 

0.0000 

0.0000 

1 

0.3774 

0.2852 

0.1529 

0.0685 

0.0268 

0.0093 

0.0029 

0.0008 

0.0002 

0.0000 

2 

0.1787 

0.2852 

0.2428 

0.1540 

0.0803 

0.0358 

0.0138 

0.0046 

0.0013 

0.0003 

3 

0.0533 

0.1796 

0.2428 

0.2182 

0.1517 

0.0869 

0.0422 

0.0175 

0.0062 

0.0018 

4 

0.0112 

0.0798 

0.1714 

0.2182 

0.2023 

0.1491 

0.0909 

0.0467 

0.0203 

0.0074 

5 

0.0018 

0.0266 

0.0907 

0.1636 

0.2023 

0.1916 

0.1468 

0.0933 

0.0497 

0.0222 

6 

0.0002 

0.0069 

0.0374 

0.0955 

0.1574 

0.1916 

0.1844 

0.1451 

0.0949 

0.0518 

7 

0.0000 

0.0014 

0.0122 

0.0443 

0.0974 

0.1525 

0.1844 

0.1797 

0.1443 

0.0961 

8 

0.0000 

0.0002 

0.0032 

0.0166 

0.0487 

0.0981 

0.1489 

0.1797 

0.1771 

0.1442 

9 

0.0000 

0.0000 

0.0007 

0.0051 

0.0198 

0.0514 

0.0980 

0.1464 

0.1771 

0.1762 

10 

0.0000 

0.0000 

0.0001 

0.0013 

0.0066 

0.0220 

0.0528 

0.0976 

0.1449 

0.1762 

11 

0.0000 

0.0000 

0.0000 

0.0003 

0.0018 

0.0077 

0.0233 

0.0532 

0.0970 

0.1442 

12 

0.0000 

0.0000 

0.0000 

0.0000 

0.0004 

0.0022 

0.0083 

0.0237 

0.0529 

0.0961 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0024 

0.0085 

0.0233 

0.0518 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

0.0024 

0.0082 

0.0222 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0022 

0.0074 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0018 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

18 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0,0000 

19 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0 

0.3585 

0.1216 

0.0388 

0.0115 

0.0032 

0.0008 

0.0002 

0.0000 

0.0000 

0.0000 

1 

0.3774 

0.2702 

0.1368 

0.0576 

0.0211 

0.0068 

0.0020 

0.0005 

0.0001 

0.0000 

2 

0.1887 

0.2852 

0.2293 

0.1369 

0.0669 

0.0278 

0.0100 

0.0031 

0.0008 

0.0002 

3 

0.0596 

0.1901 

0.2428 

0.2054 

0.1339 

0.0716 

0.0323 

0.0123 

0.0040 

0.0011 

4 

0.0133 

0.0898 

0.1821 

0.2182 

0.1897 

0.1304 

0.0738 

0.0350 

0.0139 

0.0046 

5 

0.0022 

0.0319 

0.1028 

0.1746 

0.2023 

0,1789 

0.1272 

0.0746 

0.0365 

0.0148 

6 

0.0003 

0.0089 

0.0454 

0.1091 

0.1686 

0.1916 

0.1712 

0.1244 

0.0746 

0.0370 

7 

0.0000 

0.0020 

0.0160 

0.0545 

0,1124 

0.1643 

0.1844 

0.1659 

0.1221 

0.0739 

8 

0.0000 

0.0004 

0.0046 

0.0222 

0.0609 

0.1144 

0.1614 

0.1797 

0.1623 

0.1201 

9 

0.0000 

0.0001 

0.0011 

0.0074 

0.0271 

0.0654 

0.1158 

0.1597 

0.1771 

0.1602 

10 

0.0000 

0.0000 

0.0002 

0.0020 

0.0099 

0.0308 

0.0686 

0.1171 

0.1593 

0.1762 

11 

0.0000 

0.0000 

0.0000 

0.0005 

0.0030 

0.0120 

0.0336 

0.0710 

0.1185 

0.1602 

12 

0.0000 

0.0000 

0.0000 

0.0001 

0.0008 

0.0039 

0.0136 

0.0355 

0.0727 

0.1201 

13 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0010 

0.0045 

0.0146 

0.0366 

0.0739 

14 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0012 

0.0049 

0.0150 

0.0370 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0003 

0.0013 

0.0049 

0.0148 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0003 

0.0013 

0.0046 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0011 

18 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

19 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 
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Tabla C Distribution binomial acumulada 


n 

X 

7T 

0.01 

0.05 

0.10 

0.15 

0.20 

0,25 

0.30 

0.35 

0.40 

0.45 

0.50 

2 

0 

0.9801 

0.9025 

0.8100 

0.7225 

0.6400 

0.5625 

0.4900 

0.4225 

0.3600 

0.3025 

0.2500 


1 

0.9999 

0.9975 

0.9900 

0.9775 

0.9600 

0.9375 

0.9100 

0.8775 

0.8400 

0.7975 

0.7500 

3 

0 

0.9703 

0.8574 

0.7290 

0.6141 

0.5120 

0.4219 

0.3430 

0.2746 

0.2160 

0.1664 

0.1250 


1 

0.9997 

0.9928 

0.9720 

0.9393 

0.8960 

0.8438 

0.7840 

0.7183 

0.6480 

0.5748 

0.5000 


2 

1.0000 

0.9999 

0.9990 

0.9966 

0.9920 

0.9844 

0.9730 

0.9571 

0.9360 

0.9089 

0.8750 

4 

0 

0.9606 

0.8145 

0.6561 

0.5220 

0.4096 

0.3164 

0.2401 

0.1785 

0.1296 

0.0915 

0.0625 


1 

0.9994 

0.9860 

0.9477 

0.8905 

0.8192 

0.7383 

0.6517 

0.5630 

0.4752 

0.3910 

0.3125 


2 

1 .0000 

0.9995 

0.9963 

0.9880 

0.9728 

0.9492 

0.9163 

0.8735 

0.8208 

0.7585 

0.6875 


3 

1.0000 

1.0000 

0.9999 

0.9995 

0.9984 

0.9961 

0.9919 

0.9850 

0.9744 

0.9590 

0.9375 

5 

0 

0.9510 

0.7738 

0.5905 

0.4437 

0.3277 

0.2373 

0.1681 

0.1160 

0.0778 

0.0503 

0.0313 


1 

0.9990 

0.9774 

0.9185 

0.8352 

0.7373 

0.6328 

0.5282 

0.4284 

0.3370 

0.2562 

0.1875 


2 

1.0000 

0.9988 

0.9914 

0.9734 

0.9421 

0.8965 

0.8369 

0.7648 

0.6826 

0.5931 

0.5000 


3 

1.0000 

1.0000 

0.9995 

0.9978 

0.9933 

0.9844 

0.9692 

0.9460 

0.9130 

0.8688 

0.8125 


4 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9990 

0.9976 

0.9947 

0.9898 

0.9815 

0.9688 

6 

0 

0.9415 

0.7351 

0.5314 

0.3771 

0.2621 

0.1780 

0.1176 

0.0754 

0.0467 

0.0277 

0.0156 


1 

0.9985 

0.9672 

0.8857 

0.7765 

0.6554 

0.5339 

0.4202 

0.3191 

0.2333 

0.1636 

0.1094 


2 

1.0000 

0.9978 

0.9842 

0.9527 

0.9011 

0.8306 

0.7443 

0.6471 

0.5443 

0.4415 

0.3438 


3 

1.0000 

0.9999 

0.9987 

0.9941 

0.9830 

0.9624 

0.9295 

0.8826 

0.8208 

0.7447 

0.6563 


4 

1 1.0000 

1.0000 

0.9999 

0.9996 

0.9984 

0.9954 

0.9891 

0.9777 

0.9590 

0.9308 

0.8906 


5 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9998 

0.9993 

0.9982 

0.9959 

0.9917 

0.9844 

7 

0 

0.9321 

0.6983 

0.4783 

0.3206 

0.2097 

0.1335 

0.0824 

0.0490 

0.0280 

0.0152 

0.0078 


1 

0.9980 

0.9556 

0.8503 

0.7166 

0.5767 

0.4449 

0.3294 

0.2338 

0.1586 

0.1024 

0.0625 


2 

1.0000 

0.9962 

0.9743 

0.9262 

0.8520 

0.7564 

0.6471 

0.5323 

0.4199 

0.3164 

0.2266 


3 

1.0000 

0.9998 

0.9973 

0.9879 

0.9667 

0.9294 

0.8740 

0.8002 

0.7102 

0.6083 

0.5000 


4 

1.0000 

1.0000 

0.9998 

0.9988 

0.9953 

0.9871 

0.9712 

0.9444 

0.9037 

0.8471 

0.7734 


5 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9987 

0.9962 

0.9910 

0.9812 

0.9643 

0.9375 


6 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9998 

0.9994 

0.9984 

0.9963 

0.9922 

8 

0 

0.9227 

0.6634 

0.4305 

0.2725 

0.1678 

0.1001 

0.0576 

0.0319 

0.0168 

0.0084 

0.0039 


1 

0.9973 

0.9428 

0.8131 

0.6572 

0.5033 

0.3671 

0.2553 

0.1691 

0.1064 

0.0632 

0.0352 


2 

0.9999 

0.9942 

0.9619 

0.8948 

0.7969 

0.6785 

0.5518 

0.4278 

0.3154 

0.2201 

0.1445 


3 

1.0000 

0.9996 

0.9950 

0.9786 

0.9437 

0.8862 

0.8059 

0.7064 

0.5941 

0.4770 

0.3633 


4 

1.0000 

1.0000 

0.9996 

0.9971 

0.9896 

0.9727 

0.9420 

0.8939 

0.8263 

0.7396 

0.6367 


5 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9958 

0.9887 

0.9747 

0.9502 

0.9115 

0.8555 


6 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9987 

0.9964 

0.9915 

0.9819 

0.9648 


7 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9998 

0.9993 

0.9983 

0.9961 

9 

0 

0.9135 

0.6302 

0.3874 

0.2316 

0.1342 

0.0751 

0.0404 

0.0207 

0.0101 

0.0046 

0.0020 


1 

0.9966 

0.9288 

0.7748 

0.5995 

0.4362 

0.3003 

0.1960 

0.1211 

0.0705 

0.0385 

0.0195 


2 

0.9999 

0.9916 

0.9470 

0.8591 

0.7382 

0.6007 

0.4628 

0.3373 

0.2318 

0.1495 

0.0898 


3 

1.0000 

0.9944 

0.9917 

0.9661 

0.9144 

0.8343 

0.7297 

0.6089 

0.4826 

0.3614 

0.2539 


4 

1.0000 

1.0000 

0.9991 

0.9944 

0.9804 

0.9511 

0.9012 

0.8283 

0.7334 

0.6214 

0.5000 


5 

1.0000 

1.0000 

0.9999 

0.9994 

0.9969 

0.9900 

0.9747 

0.9464 

0.9006 

0.8342 

0.7461 


6 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9987 

0.9957 

0.9888 

0.9750 

0.9502 

0.9102 


7 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9986 

0.9962 

0.9909 

0.9805 


8 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9992 

0.9980 

10 

0 

0.9044 

0.5987 

0.3487 

0.1969 

0.1074 

0.0563 

0.0282 

0.0135 

0.0060 

0.0025 

0.0010 
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Tabla C Distribution binomial acumulada (continuation) 


n 

X 

IT 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

10 

1 

0.9957 

0.9139 

0.7361 

0.5443 

0.3758 

0.2440 

0.1493 

0.0860 

0.0464 

0.0233 

0.0107 


2 

0.9999 

0.9885 

0.9298 

0.8202 

0.6778 

0.5256 

0.3828 

0.2616 

0.1673 

0.0996 

0.0547 


3 

1.0000 

0.9990 

0.9872 

0.9500 

0.8791 

0.7759 

0.6496 

0.5138 

0.3823 

0.2660 

0.1719 


4 

1.0000 

0.9999 

0.9984 

0.9901 

0.9672 

0.9219 

0.8497 

0.7515 

0.6331 

0.5044 

0.3770 


5 

1.0000 

1.0000 

0.9999 

0.9986 

0.9936 

0.9803 

0.9527 

0.9051 

0.8338 

0.7384 

0.6230 


6 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9965 

0.9894 

0.9740 

0.9452 

0.8980 

0.8281 


7 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9984 

0.9952 

0.9877 

0.9726 

0.9453 


8 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9983 

0.9955 

0.9893 


9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9990 

11 

0 

0.8953 

0.5688 

0.3138 

0.1673 

0.0859 

0.0422 

0.0198 

0.0088 

0.0036 

0.0014 

0.0005 


1 

0.9948 

0.8981 

0.6974 

0.4922 

0.3221 

0.1971 

0.1130 

0.0606 

0.0302 

0.0139 

0.0059 


2 

0.9998 

0.9848 

0.9104 

0.7788 

0.6174 

0.4552 

0.3127 

0.2001 

0.1189 

0.0652 

0.0327 


3 

1.0000 

0.9984 

0.9815 

0.9306 

0.8389 

0.7133 

0.5696 

0.4256 

0.2963 

0.1911 

0.1133 


4 

1.0000 

0.9999 

0.9972 

0.9841 

0.9496 

0.8854 

0.7897 

0.6683 

0.5328 

0.3971 

0.2744 


5 

1.0000 

1.0000 

0.9997 

0.9973 

0.9883 

0.9657 

0.9218 

0.8513 

0.7535 

0.6331 

0.5000 


6 

1.0000 

1.0000 

1.0000 

0.9997 

0.9980 

0.9924 

0.9784 

0.9499 

0.9006 

0.8262 

0.7256 


7 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9957 

0.9878 

0.9707 

0.9390 

0.8867 


8 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9980 

0.9941 

0.9852 

0.9673 


9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9993 

0.9978 

0.9941 


10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9995 

12 

0 

0.8864 

0.5404 

0.2824 

0.1422 

0.0687 

0.0317 

0.0138 

0.0057 

0.0022 

0.0008 

0.0002 


1 

0.9938 

0.8816 

0.6590 

0.4435 

0.2749 

0.1584 

0.0850 

0.0424 

0.0196 

0.0083 

0.0032 


2 

0.9998 

0.9804 

0.8891 

0.7358 

0.5583 

0.3907 

0.2528 

0.1513 

0.0834 

0.0421 

0.0193 


3 

1.0000 

0.9978 

0.9744 

0.9078 

0.7946 

0.6488 

0.4925 

0.3467 

0.2253 

0.1345 

0.0730 


4 

1.0000 

0.9998 

0.9957 

0.9761 

0.9274 

0.8424 

0.7237 

0.5833 

0.4382 

0.3044 

0.1938 


5 

1.0000 

1.0000 

0.9995 

0.9954 

0.9806 

0.9456 

0.8822 

0.7873 

0.6652 

0.5269 

0.3872 


6 

1.0000 

1.0000 

0.9999 

0.9993 

0.9961 

0.9857 

0.9614 

0.9154 

0.8418 

0.7393 

0.6128 


7 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9972 

0.9905 

0.9745 

0.9427 

0.8883 

0.8062 


8 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9983 

0.9944 

0.9847 

0.9644 

0.9270 


9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9992 

0.9972 

0.9921 

0.9807 


10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9989 

0.9968 


11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9998 

13 

0 

0.8775 

0.5133 

0.2542 

0.1209 

0.0550 

0.0238 

0.0097 

0.0037 

0.0013 

0.0004 

0.0001 


1 

0.9928 

0.8646 

0.6213 

0.3983 

0.2336 

0.1267 

0.0637 

0.0296 

0.0126 

0.0049 

0.0017 


2 

0.9997 

0.9755 

0.8661 

0.6920 

0.5017 

0.3326 

0.2025 

0.1132 

0.0579 

0.0269 

0.0112 


3 

1.0000 

0.9969 

0.9658 

0.8820 

0.7473 

0.5843 

0.4206 

0.2783 

0.1686 

0.0929 

0.0461 


4 

1.0000 

0.9997 

0.9935 

0.9658 

0.9009 

0.7940 

0.6543 

0.5005 

0.3530 

0.2279 

0.1334 


5 

1.0000 

1.0000 

0.9991 

0.9925 

0.9700 

0.9198 

0.8346 

0.7159 

0.5744 

0.4268 

0.2905 


6 

1.0000 

1.0000 

0.9999 

0.9987 

0.9930 

0.9757 

0.9376 

0.8705 

0.7712 

0.6437 

0.5000 


7 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9944 

0.9818 

0.9538 

0.9023 

0.8212 

0.7095 


8 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9990 

0.9960 

0.9874 

0.9679 

0.9302 

0.8666 


9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9975 

0.9922 

0.9797 

0.9539 


10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9987 

0.9959 

0.9888 


11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9983 


12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 
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Tabla C Distribucion binomial acumulada (continuacion) 


X 

77 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0,40 

0.45 

0.50 

0 

0.8687 

0.4877 

0.2288 

0.1028 

0.0440 

0.0178 

0.0068 

0.0024 

0.0008 

0.0002 

0.0001 

1 

0.9916 

0.8470 

0.5846 

0.3567 

0.1979 

0.1010 

0.0475 

0.0205 

0.0081 

0.0029 

0.0009 

2 

0.9997 

0.9699 

0.8416 

0.6479 

0.4481 

0.2811 

0.1608 

0.0839 

0.0398 

0.0170 

0.0065 

3 

1.0000 

0.9958 

0.9559 

0.8535 

0.6982 

0.5213 

0.3552 

0.2205 

0.1243 

0.0632 

0.0287 

4 

1.0000 

0.9996 

0.9908 

0.9533 

0.8702 

0.7415 

0.5842 

0.4227 

0.2793 

0.1672 

0.0898 

5 

1.0000 

1.0000 

0.9985 

0.9885 

0.9561 

0.8883 

0.7805 

0.6405 

0.4859 

0.3373 

0.2120 

6 

1.0000 

1.0000 

0.9998 

0.9978 

0.9884 

0.9617 

0.9067 

0.8164 

0.6925 

0.5461 

0.3953 

7 

1.0000 

1.0000 

1.0000 

0.9997 

0.9976 

0.9897 

0.9685 

0.9247 

0.8499 

0.7414 

0.6047 

8 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9978 

0.9917 

0.9757 

0.9417 

0.8811 

0.7880 

9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9983 

0.9940 

0.9825 

0.9574 

0.9102 

10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9989 

0.9961 

0.9886 

0.9713 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9978 

0.9935 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9991 

13 

1.0000 

1 .0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0 

0.8601 

0.4633 

0.2059 

0.0874 

0.0352 

0.0134 

0.0047 

0.0016 

0.0005 

0.0001 

0.0000 

1 

0.9904 

0.8290 

0.5490 

0.3186 

0.1671 

0.0802 

0.0353 

0.0142 

0.0052 

0.0017 

0.0005 

2 

0.9996 

0.9638 

0.8159 

0.6042 

0.3980 

0.2361 

0.1268 

0.0617 

0.0271 

0.0107 

0.0037 

3 

1.0000 

0.9945 

0.9444 

0.8227 

0.6482 

0.4613 

0.2969 

0.1727 

0.0905 

0.0424 

0.0176 

4 

1.0000 

0.9994 

0.9873 

0,9383 

0.8358 

0.6865 

0,5155 

0.3519 

0.2173 

0.1204 

0.0592 

5 

1.0000 

0.9999 

0.9978 

0.9832 

0.9389 

0.8516 

0.7216 

0.5643 

0.4032 

0.2608 

0.1509 

6 

1.0000 

1.0000 

0.9997 

0.9964 

0.9819 

0.9434 

0.8689 

0.7548 

0.6098 

0.4522 

0.3036 

7 

1.0000 

1.0000 

1.0000 

0.9994 

0.9958 

0.9827 

0.9500 

0.8868 

0.7869 

0.6535 

0.5000 

8 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9958 

0.9848 

0.9578 

0.9050 

0.8182 

0.6964 

9 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9963 

0.9876 

0.9662 

0.9231 

0.8491 

10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9972 

0.9907 

0.9745 

0.9408 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9981 

0.9937 

0.9824 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9989 

0.9963 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.8515 

0.4401 

0.1853 

0.0743 

0.0281 

0.0100 

0.0033 

0.0010 

0.0003 

0.0001 

0.0000 

1 

0.9891 

0.8108 

0.5147 

0.2839 

0.1407 

0.0635 

0.0261 

0.0098 

0.0033 

0.0010 

0.0003 

2 

0.9995 

0.9571 

0.7892 

0.5614 

0.3518 

0.1971 

0.0994 

0.0451 

0.0183 

0.0066 

0.0021 

3 

1.0000 

0.9930 

0.9316 

0.7899 

0.5981 

0.4050 

0.2459 

0.1339 

0.0651 

0.0281 

0.0106 

4 

1 .0000 

0.9991 

0.9830 

0.9209 

0.7982 

0.6302 

0.4499 

0.2892 

0.1666 

0.0853 

0.0384 

i 

5 1 

1.0000 

0.9999 

0.9967 

0.9765 

0.9183 

0.8103 

0.6598 

0.4900 

0.3288 

0.1976 

0.1051 

6 

1.0000 

1.0000 

0.9995 

0.9944 

0.9733 

0.9204 

0.8247 

0.6881 

0.5272 

0.3660 

0.2272 

7 

1.0000 

1.0000 

0.9999 

0.9989 

0.9930 

0.9729 

0.9256 

0.8406 

0.7161 

0.5629 

0.4018 

8 

1.0000 

1.0000 

1.0000 

0.9998 

0.9985 

0.9925 

0.9743 

0.9329 

0.8577 

0.7441 

0.5982 

9 1 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9984 

0.9929 

0.9771 

0.9417 

0.8759 

0.7728 

10 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9984 

0.9938 

0.9809 

0.9514 

0.8949 

11 

1.0000 

1 .0000 

1 .0000 

1.0000 

1.0000 

1 .0000 

0.9997 

0.9987 

0.9951 

0.9851 

09616 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9991 

0.9965 

0.9894 

13 

1.0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1 .0000 

1 .0000 

0.9999 

0.9994 

0.9979 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 
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Tabla C Distribution binomial acumulada (continuation) 


X 

77 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

0 

0.8429 

0.4181 

0.1668 

0.0631 

0.0225 

0.0075 

0.0023 

0.0007 

0.0002 

0.0000 

0.0000 

1 

0.9877 

0.7922 

0.4818 

0.2525 

0.1182 

0.0501 

0.0193 

0.0067 

0.0021 

0.0006 

0.0001 

2 

0.9994 

0.9497 

0.7618 

0.5198 

0.3096 

0.1637 

0.0774 

0.0327 

0.0123 

0.0041 

0.0012 

3 

1.0000 

0.9912 

0.9174 

0.7556 

0.5489 

0.3530 

0.2019 

0.1028 

0.0464 

0.0184 

0.0064 

4 

1.0000 

0.9988 

0.9779 

0.9013 

0.7582 

0.5739 

0.3887 

0.2348 

0.1260 

0.0596 

0.0245 

5 

1.0000 

0.9999 

0.9953 

0.9681 

0.8943 

0.7653 

0.5968 

0.4197 

0.2639 

0.1471 

0.0717 

6 

1.0000 

1.0000 

0.9992 

0.9917 

0.9623 

0.8929 

0.7752 

0.6188 

0.4478 

0.2902 

0.1662 

7 

1.0000 

1.0000 

0.9999 

0.9983 

0.9891 

0.9598 

0.8954 

0.7872 

0.6405 

0.4743 

0.3145 

8 

1.0000 

1.0000 

1.0000 

0.9997 

0.9974 

0.9876 

0.9597 

0.9006 

0.8011 

0.6626 

0.5000 

9 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9969 

0.9873 

0.9617 

0.9081 

0.8166 

0.6855 

10 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9968 

0.9880 

0.9652 

0.9174 

0.8338 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9970 

0.9894 

0.9699 

0.9283 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9975 

0.9914 

0.9755 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9981 

0.9936 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9997 

0.9988 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.8345 

0.3972 

0.1501 

0.0536 

0.0180 

0.0056 

0.0016 

0.0004 

0.0001 

0.0000 

0.0000 

1 

0.9862 

0.7735 

0.4503 

0.2241 

0.0991 

0.0395 

0.0142 

0.0046 

0.0013 

0.0003 

0.0001 

2 

0.9993 

0.9419 

0.7338 

0.4797 

0.2713 

0.1353 

0.0600 

0.0236 

0.0082 

0.0025 

0.0007 

3 

1.0000 

0.9891 

0.9018 

0.7202 

0.5010 

0.3057 

0.1646 

0.0783 

0.0328 

0.0120 

0.0038 

4 

1.0000 

0.9985 

0.9718 

0.8794 

0.7164 

0.5187 

0.3327 

0.1886 

0.0942 

0.0411 

0.0154 

5 

1.0000 

0.9998 

0.9936 

0.9581 

0.8671 

0.7175 

0.5344 

0.3550 

0.2088 

0.1077 

0.0481 

6 

1.0000 

1.0000 

0.9988 

0.9882 

0.9487 

0.8610 

0.7217 

0.5491 

0.3743 

0.2258 

0.1189 

7 

1.0000 

1.0000 

0.9998 

0.9973 

0.9837 

0.9431 

0.8593 

0.7283 

0.5634 

0.3915 

0.2403 

8 

1.0000 

1.0000 

1.0000 

0.9995 

0.9957 

0.9807 

0.9404 

0.8609 

0.7368 

0.5778 

0.4073 

9 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9946 

0.9790 

0.9403 

0.8653 

0.7473 

0.5927 

10 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9939 

0.9788 

0.9424 

0.8720 

0.7597 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9986 

0.9938 

0.9797 

0.9463 

0.8811 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9986 

0.9942 

0.9817 

0.9519 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9987 

0.9951 

0.9846 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9990 

0.9962 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

16 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

17 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1,0000 

0 

0.8262 

0.3774 

0.1351 

0.0456 

0.0144 

0.0042 

0.0011 

0.0003 

0.0001 

0.0000 

0.0000 

1 

0.9847 

0.7547 

0.4203 

0.1985 

0.0829 

0.0310 

0.0104 

0.0031 

0.0008 

0.0002 

0.0000 

2 

0.9991 

0.9335 

0.7054 

0.4413 

0.2369 

0.1113 

0.0462 

0.0170 

0.0055 

0.0015 

0.0004 

3 

1.0000 

0.9868 

0.8850 

0.6841 

0.4551 

0.2631 

0.1332 

0 . 0591 ' 

0.0230 

0.0077 

0.0022 

4 

1.0000 

0.9980 

0.9648 

0.8556 

0.6733 

0.4654 

0.2822 

0.1500 

0.0696 

0.0280 

0.0096 

5 

1.0000 

0.9998 

0.9914 

0.9463 

0.8369 

0.6678 

0.4739 

0.2968 

0.1629 

0.0777 

0.0318 

6 

1.0000 

1.0000 

0.9983 

0.9837 

0.9324 

0.8251 

0.6655 

0.4812 

0.3081 

0.1727 

0.0835 

7 

1.0000 

1.0000 

0.9997 

0.9959 

0.9767 

0.9225 

0.8180 

0.6656 

0.4878 

0.3169 

0.1796 

8 

1.0000 

1.0000 

1.0000 

0.9992 

0.9933 

0.9713 

0.9161 

0.8145 

0.6675 

0.4940 

0.3238 

9 

1.0000 

1.0000 

1.0000 

0.9999 

0.9984 

0.9911 

0.9674 

0.9125 

0.8139 

0.6710 

0.5000 
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Tabla C Distribution binomial acumulada (continuation) 



TT 

X 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

10 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9977 

0.9895 

0.9653 

0.9115 

0.8159 

0.6762 

11 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9972 

0.9886 

0.9648 

0.9129 

0.8204 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9969 

0.9884 

0.9658 

0.9165 

13 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9969 

0.9891 

0.9682 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9972 

0.9904 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9978 

16 

1.0000 

1.0000 

1.0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.8179 

0.3585 

0.1216 

0.0388 

0.0115 

0.0032 

0.0008 

0.0002 

0.0000 

0.0000 

0.0000 

1 

0.9831 

0.7358 

0.3917 

0.1756 

0.0692 

0.0243 

0.0076 

0.0021 

0.0005 

0.0001 

0.0000 

2 

0.9990 

0.9245 

0.6769 

0.4049 

0.2061 

0.0913 

0.0355 

0.0121 

0.0036 

0.0009 

0.0002 

3 

1.0000 

0.9841 

0.8670 

0.6477 

0.4114 

0.2252 

0.1071 

0.0444 

0.0160 

0.0049 

0.0013 

4 

1 .0000 

0.9974 

0.9568 

0.8298 

0.6296 

0.4148 

0.2375 

0.1182 

0.0510 

0.0189 

0.0059 

5 

1.0000 

0.9997 

0.9887 

0.9327 

0.8042 

0.6172 

0.4164 

0.2454 

0.1256 

0.0553 

0.0207 

6 

1.0000 

1.0000 

0.9976 

0.9781 

0.9133 

0.7858 

0.6080 

0.4166 

0.2500 

0.1299 

0.0577 

7 

1.0000 

1.0000 

0.9996 

0.9941 

0.9679 

0.8982 

0.7723 

0.6010 

0.4159 

0.2520 

0.1316 

8 

1 .0000 

1.0000 

0.9999 

0.9987 

0.9900 

0.9591 

0.8867 

0.7624 

0.5956 

0.4143 

0.2517 

9 

1.0000 

1.0000 

1.0000 

0.9998 

0.9974 

0.9861 

0.9520 

0.8782 

0.7553 

0.5914 

0.4119 

10 

1.0000 

1.0000 

1.0000 

1.0000 

0.9994 

0.9961 

0.9829 

0.9468 

0.8725 

0.7507 

0.5881 

11 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9949 

0.9804 

0.9435 

0.8692 

0.7483 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9987 

0.9940 

0.9790 

0.9420 

0.8684 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9985 

0.9935 

0.9786 

0.9423 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9984 

0.9936 

0.9793 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9985 

0.9941 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9987 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.8097 

0.3406 

0.1094 

0.0329 

0.0092 

0.0024 

0.0006 

0.0001 

0.0000 

0.0000 

0.0000 

1 

0.9815 

0.7170 

0.3647 

0.1550 

0.0576 

0.0190 

0.0056 

0.0014 

0.0003 

0.0001 

0.0000 

2 

0.9988 

0.9151 

0.6484 

0.3705 

0.1787 

0.0745 

0.0271 

0.0086 

0.0024 

0.0006 

0.0001 

3 

0.9999 

0.9811 

0.8480 

0.6113 

0.3704 

0.1917 

0.0856 

0.0331 

0.0110 

0.0031 

0.0007 

4 

1.0000 

0.9968 

0.9478 

0.8025 

0.5860 

0.3674 

0.1984 

0.0924 

0.0370 

0.0126 

0.0036 

5 

1.0000 

0.9996 

0.9856 

0.9173 

0.7693 

0.5666 

0.3627 

0.2009 

0.0957 

0.0389 

0.0133 

6 

1.0000 

1.0000 

0.9967 

0.9713 

0.8915 

0.7436 

0.5505 

0.3567 

0.2002 

0.0964 

0.0392 

7 

1.0000 

1.0000 

0.9994 

0.9917 

0.9569 

0.8701 

0.7230 

0.5365 

0.3495 

0.1971 

0.0946 

8 

1.0000 

1.0000 

0.9999 

0.9980 

0.9856 

0.9439 

0.8523 

0.7059 

0.5237 

0.3413 

0.1917 

9 

1.0000 

1.0000 

1.0000 

0.9996 

0.9959 

0.9794 

0.9324 

0.8377 

0.6914 

0.5117 

0.3318 

10 

1.0000 

1.0000 

1.0000 

0.9999 

0.9990 

0.9936 

0.9736 

0.9228 

0.8256 

0.6790 

0.5000 

11 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9983 

0.9913 

0.9687 

0.9151 

0.8159 

0.6682 

12 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9976 

0.9892 

0.9648 

0.9092 

0.8083 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9994 

0.9969 

0.9877 

0.9621 

0.9054 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9964 

0.9868 

0.9608 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9963 

0.9867 

16 

1.0000 

1,0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9992 

0.9964 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 
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Tabla C Distribution binomial acumulada (continuacion) 



77 

X 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

18 ! 

1.0000 

1,0000 u 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.8016 

0.3235 

0.0985 

0.0280 

0.0074 

0.0018 

0.0004 

0.0001 

0.0000 

0.0000 

0.0000 

1 

0.9798 

0.6982 

0.3392 

0.1367 

0.0480 

0.0149 

0.0041 

0.0010 

0.0002 

0.0000 

0.0000 

2 

0.9987 

0.9052 

0.6200 

0.3382 

0.1545 

0.0606 

0.0207 

0.0061 

0.0016 

0.0003 

0.0001 

3 

0.9999 

0.9778 

0.8281 

0.5752 

0.3320 

0.1624 

0.0681 

0.0245 

0.0076 

0.0020 

0.0004 

4 

1.0000 

0.9960 

0.9379 

0.7738 

0.5429 

0.3235 

0.1645 

0.0716 

0.0266 

0.0083 

0.0022 

5 

1.0000 

0.9994 

0.9818 

0.9001 

0.7326 

0.5168 

0.3134 

0.1629 

0.0722 

0.0271 

0.0085 

6 

1.0000 

0.9999 

0.9956 

0.9632 

0.8670 

0.6994 

0.4942 

0.3022 

0.1584 

0.0705 

0.0262 

7 

1.0000 

1.0000 

0.9991 

0.9886 

0.9439 

0.8385 

0.6713 

0.4736 

0.2898 

0.1518 

0.0669 

8 

1.0000 

1.0000 

0.9999 

0.9970 

0.9799 

0.9254 

0.8135 

0.6466 

0.4540 

0.2764 

0.1431 

9 

1.0000 

1.0000 

1.0000 

0.9993 

0.9939 

0.9705 

0.9084 

0.7916 

0.6244 

0.4350 

0.2617 

10 

1.0000 

1.0000 

1.0000 

0.9999 

0.9984 

0.9900 

0.9613 

0.8930 

0.7720 

0.6037 

0.4159 

11 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9971 

0.9860 

0.9526 

0,8793 

0.7543 

0.5841 

12 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9957 

0.9820 

0.9449 

0.8672 

0.7383 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9989 

0.9942 

0.9785 

0.9383 

0.8569 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9984 

0.9930 

0.9757 

0.9331 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9981 

0.9920 

0.9738 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9979 

0.9915 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9978 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

20 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.7936 

0.3074 

0.0886 

0.0238 

0.0059 

0.0013 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9780 

0.6794 

0.3151 

0.1204 

0.0398 

0.0116 

0.0030 

0.0007 

0.0001 

0.0000 

0.0000 

2 

0.9985 

0.8948 

0.5920 

0.3080 

0.1332 

0.0492 

0.0157 

0.0043 

0,0010 

0.0002 

0.0000 

3 

0.9999 

0.9742 

0.8073 

0.5396 

0.2965 

0.1370 

0.0538 

0.0181 

0.0052 

0.0012 

0.0002 

4 

1.0000 

0.9951 

0.9269 

0.7440 

0.5007 

0.2832 

0.1356 

0.0551 

0.0190 

0.0055 

0.0013 

5 

1.0000 

0.9992 

0.9774 

0.8811 

0.6947 

0.4685 

0.2688 

0.1309 

0.0540 

0.0186 

0.0053 

6 

1.0000 

0.9999 

0.9942 

0.9537 

0.8402 

0.6537 

0.4399 

0.2534 

0.1240 

0.0510 

0.0173 

7 

1.0000 

1.0000 

0.9988 

0.9848 

0.9285 

0.8037 

0.6181 

0.4136 

0.2373 

0.1152 

0.0466 

8 

1.0000 

1.0000 

0.9998 

0.9958 

0.9727 

0.9037 

0.7709 

0.5860 

0.3884 

0.2203 

0.1050 

9 

1.0000 

1 .0000 

1.0000 

0.9990 

0.9911 

0.9592 

0.8799 

0.7408 

0.5562 

0.3636 

0.2024 

10 

1.0000 

1 .0000 

1.0000 

0.9998 

0.9975 

0.9851 

0.9454 

0.8575 

0.7129 

0,5278 

0.3388 

11 

1.0000 

1.0000 

1.0000 

1.0000 

0.9994 

0.9954 

0.9786 

0.9318 

0.8364 

0.6865 

0.5000 

12 

1 .0000 

1.0000 

1 .0000 

1.0000 

0.9999 

0.9988 

0.9928 

0.9717 

0.9187 

0.8164 

0.6612 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9979 

0.9900 

0.9651 

0.9063 

0.7976 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9970 

0.9872 

0.9589 

0.8950 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9960 

0.9847 

0.9534 

16 

1,0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9990 

0,9952 

0.9827 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9947 

18 

1.0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9987 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

20 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 
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Tabla C Distribucion binomial acumulada (continuacion) 


n 

24 


X 

7T 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

0 

0.7857 

0.2920 

0.0798 

0.0202 

0.0047 

0.0010 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9761 

0.6608 

0.2925 

0.1059 

0.0331 

0.0090 

0.0022 

0.0005 

0.0001 

0.0000 

0.0000 

2 

0.9983 

0.8841 

0.5643 

0.2798 

0.1145 

0.0398 

0.0119 

0.0030 

0.0007 

0.0001 

0.0000 

3 

0.9999 

0.9702 

0.7857 

0.5049 

0,2639 

0.1150 

0.0424 

0.0133 

0.0035 

0.0008 

0.0001 

4 

1.0000 

0.9940 

0.9149 

0.7134 

0.4599 

0.2466 

0.1111 

0.0422 

0.0134 

0.0036 

0.0008 

5 

1.0000 

0.9990 

0.9723 

0.8606 

0.6559 

0.4222 

0.2288 

0.1044 

0.0400 

0.0127 

0.0033 

6 

1.0000 

0.9999 

0.9925 

0.9428 

0.8111 

0.6074 

0.3886 

0.2106 

0.0960 

0.0364 

0.0113 

7 

1.0000 

1.0000 

0.9983 

0.9801 

0.9108 

0.7662 

0.5647 

0.3575 

0.1919 

0.0863 

0.0320 

8 

1.0000 

1.0000 

0.9997 

0.9941 

0.9638 

0.8787 

0.7250 

0.5257 

0.3279 

0.1730 

0.0758 

9 

1.0000 

1.0000 

0.9999 

0.9985 

0.9874 

0.9453 

0.8472 

0.6866 

0.4891 

0.2991 

0.1537 

10 

1.0000 

1.0000 

1.0000 

0.9997 

0.9962 

0.9787 

0.9258 

0.8167 

0.6502 

0.4539 

0.2706 

11 

1.0000 

1.0000 

1.0000 

0.9999 

0.9990 

0.9928 

0.9686 

0.9058 

0.7870 

0.6151 

0.4194 

12 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9979 

0.9885 

0.9577 

0.8857 

0.7580 

0.5806 

13 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9964 

0.9836 

0.9465 

0.8659 

0.7294 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9990 

0.9945 

0.9783 

0.9352 

0.8463 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9984 

0.9925 

0.9731 

0.9242 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9978 

0.9905 

0.9680 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

0.9972 

0.9887 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9993 

0.9967 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

20 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

21 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.7778 

0.2774 

0.0718 

0.0172 

0.0038 

0.0008 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9742 

0.6424 

0.2712 

0.0931 

0.0274 

0.0070 

0.0016 

0.0003 

0.0001 

0.0000 

0.0000 

2 

0.9980 

0.8729 

0.5371 

0.2537 

0.0982 

0.0321 

0.0090 

0.0021 

0.0004 

0.0001 

0.0000 

3 

0.9999 

0.9659 

0.7636 

0.4711 

0.2340 

0.0962 

0.0332 

0.0097 

0.0024 

0.0005 

0.0001 

4 

1.0000 

0.9928 

0.9020 

0.6821 

0,4207 

0.2137 

0.0905 

0.0320 

0.0095 

0.0023 

0.0005 

5 

1.0000 

0.9988 

0.9666 

0.8385 

0.6167 

0.3783 

0.1935 

0.0826 

0.0294 

0.0086 

0.0020 

6 

1.0000 

0.9998 

0.9905 

0.9305 

0.7800 

0.5611 

0.3407 

0.1734 

0.0736 

0.0258 

0.0073 

7 

1.0000 

1.0000 

0.9977 

0.9745 

0,8909 

0.7265 

0.5118 

0.3061 

0.1536 

0.0639 

0.0216 

8 

1.0000 

1.0000 

0.9995 

0.9920 

0.9532 

0.8506 

0.6769 

0.4668 

0.2735 

0.1340 

0.0539 

9 

1.0000 

1.0000 

0.9999 

0.9979 

0.9827 

0.9287 

0.8106 

0.6303 

0.4246 

0.2424 

0.1148 

10 

1.0000 

1.0000 

1.0000 

0.9995 

0.9944 

0.9703 

0.9022 

0.7712 

0.5858 

0.3843 

0.2122 

11 

1.0000 

1.0000 

1.0000 

0.9999 

0.9985 

0.9893 

0.9558 

0.8746 

0.7323 

0.5426 

0.3450 

12 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9966 

0.9825 

0.9396 

0.8462 

0.6937 

0.5000 

13 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9940 

0.9745 

0.9222 

0.8173 

0.6550 

14 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9982 

0.9907 

0.9656 

0.9040 

0.7878 

15 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9971 

0.9868 

0.9560 

0.8852 

16 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9992 

0.9957 

0.9826 

0.9461 

17 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9988 

0.9942 

0.9784 

18 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9984 

0.9927 

19 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9996 

0.9980 

20 

1.0000 

1.0000 

1.0000 

1,0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9995 

21 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

22 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 


25 
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Tabla C Distribucion binomial aeumulada (continuacion) 


X 

7T 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

0 

0.6050 

0.0769 , 

0.0052 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.9106 

0.2794 

0.0338 

0.0029 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9862 

0.5405 

0.1117 

0.0142 

0.0013 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

0.9984 

0.7604 

0.2503 

0.0460 

0.0057 

0.0005 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

4 

0.9999 

0.8964 

0.4312 

0.1121 

0.0185 

0.0021 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

5 

1.0000 

0.9622 

0.6161 

0.2194 

0.0480 

0.0070 

0.0007 

0.0001 

0.0000 

0.0000 

0.0000 

6 

1.0000 

0.9882 

0.7702 

0.3613 

0.1034 

0.0194 

0.0025 

0.0002 

0.0000 

0.0000 

0.0000 

7 

1.0000 

0.9968 

0.8779 

0.5188 

0.1904 

0.0453 

0.0073 

0.0008 

0.0001 

0.0000 

0.0000 

8 

1.0000 

0.9992 

0.9421 

0.6681 

0.3073 

0.0916 

0.0183 

0.0025 

0.0002 

0.0000 

0.0000 

9 

1.0000 

0.9998 

0.9755 

0.7911 

0.4437 

0.1637 

0.0402 

0.0067 

0.0008 

0.0001 

0.0000 

10 

1.0000 

1.0000 

0.9906 

0.8801 

0.5836 

0.2622 

0.0789 

0.0160 

0.0022 

0.0002 

0.0000 

11 

1 .0000 

1.0000 

0.9968 

0.9372 

0.7107 

0.3816 

0.1390 

0.0342 

0.0057 

0.0006 

0.0000 

12 

1.0000 

1.0000 

0.9990 

0.9699 

0.8139 

0.5110 

0.2229 

0.0661 

0.0133 

0.0018 

0.0002 

13 

1.0000 

1.0000 

0.9997 

0.9868 

0.8894 

0.6370 

0.3279 

0.1163 

0.0280 

0.0045 

0.0005 

14 

1.0000 

1.0000 

0.9999 

0.9947 

0.9393 

0.7481 

0.4468 

0.1878 

0.0540 

0.0104 

0.0013 

15 

1.0000 

1.0000 

1.0000 

0.9981 

0.9692 

0.8369 

0.5692 

0.2801 

0.0955 

0.0220 

0.0033 

16 

1.0000 

1.0000 

1 .0000 

0.9993 

0.9856 

0.9017 

0.6839 

0.3889 

0.1561 

0.0427 

0.0077 

17 

1 .0000 

1.0000 

1.0000 

0.9998 

0.9937 

0.9449 

0.7822 

0.5060 

0.2369 

0.0765 

0.0164 

18 

1.0000 

1.0000 

1.0000 

0.9999 

0.9975 

0.9713 

0.8594 

0.6216 

0.3356 

0.1273 

0.0325 

19 

1.0000 

1.0000 

1.0000 

1.0000 

0.9991 

0.9861 

0.9152 

0.7264 

0.4465 

0.1974 

0.0595 

20 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9937 

0.9522 

0.8139 

0.5610 

0.2862 

0.1013 

21 

1.0000 

1.0000 

1 .0000 

1 .0000 

0.9999 

0.9974 

0.9749 

0.8813 

0.6701 

0.3900 

0.1611 

22 

1.0000 

1.0000 

1.0000 

1 .0000 

1.0000 

0.9990 

0.9877 

0.9290 

0.7660 

0.5019 

0.2399 

23 

1.0000 

1.0000 

1.0000 

1 .0000 

1.0000 

0.9996 

0.9944 

0.9604 

0.8348 

0.6134 

0.3359 

24 

1.0000 

1 .0000 

1 .0000 

1 .0000 

1.0000 

0.9999 

0.9976 

0.9793 

0.9022 

0.7160 

0.4439 

25 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9991 

0.9900 

0.9427 

0.8034 

0.5561 

26 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9955 

0.9686 

0.8721 

0.6641 

27 

1 .0000 

1.0000 

1 .0000 

1 .0000 

1.0000 

1 .0000 

0.9999 

0.9981 

0.9840 

0.9220 

0.7601 

28 

1.0000 

1.0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9993 

0.9924 

0.9556 

0.8389 

29 

1.0000 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9966 

0.9765 

0.8987 

30 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9986 

0.9884 

0.9405 

31 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1 .0000 

1.0000 

1.0000 

0.9995 

0.9947 

0.9675 

32 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9978 

0.9836 

33 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9991 

0.9923 

34 

1 .0000 

1.0000 

1.0000 

1.0000 

1.0000 

1 .0000 

1 .0000 

1 .0000 

1 .0000 

0.9997 

0.9967 

35 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9987 

36 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

37 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

38 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0 

0.3660 

0.0059 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.7358 

0.0371 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.9206 

0.1183 

0.0019 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

0.9816 

0.2578 

0.0078 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

4 

0.9966 

0.4360 

0.0237 

0.0004 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

5 

0.9995 

0.6160 

0.0576 

0.0016 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 
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Tabla C Distribucion binomial acumulada (continuacion) 


n X 

TT 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

100 6 

0.9999 

0.7660 

0.1172 

0.0047 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

7 

1.0000 

0.8720 

0.2061 

0.0122 

0.0003 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

8 

1.0000 

0.9369 

0.3209 

0.0275 

0.0009 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

9 

1.0000 

0.9718 

0.4513 

0.0551 

0.0023 

0.0000 

0.0000 

0.0000 

0,0000 

0.0000 

0.0000 

10 

1.0000 

0.9885 

0.5832 

0.0994 

0.0057 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

11 

1.0000 

0.9957 

0.7030 

0.1635 

0.0126 

0.0004 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

12 

1.0000 

0.9985 

0.8018 

0.2473 

0.0253 

0.0010 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

13 

1.0000 

0.9995 

0.8761 

0.3474 

0.0469 

0.0025 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

14 

1.0000 

0.9999 

0.9274 

0.4572 

0.0804 

0.0054 

0.0002 

0.0000 

0.0000 

0.0000 

0.0000 

15 

1.0000 

1.0000 

0.9601 

0.5683 

0.1285 

0.0111 

0.0004 

0.0000 

0.0000 

0.0000 

0.0000 

16 

1.0000 

1.0000 

0.9794 

0.6725 

0.1923 

0.0211 

0.0010 

0.0000 

0.0000 

0.0000 

0.0000 

17 

1.0000 

1.0000 

0.9900 

0.7633 

0.2712 

0.0376 

0.0022 

0.0001 

0.0000 

0.0000 

0.0000 

18 

1.0000 

1.0000 

0.9954 

0.8372 

0.3621 

0.0630 

0.0045 

0.0001 

0.0000 

0.0000 

0.0000 

19 

1.0000 

1.0000 

0.9980 

0.8935 

0.4602 

0.0995 

0.0089 

0.0003 

0.0000 

0.0000 

0.0000 

20 

1.0000 

1.0000 

0.9992 

0.9337 

0.5595 

0.1488 

0.0165 

0.0008 

0.0000 

0.0000 

0.0000 

21 

1.0000 

1.0000 

0.9997 

0.9607 

0.6540 

0.2114 

0.0288 

0.0017 

0.0000 

0.0000 

0.0000 

22 

1.0000 

1.0000 

0.9999 

0.9779 

0.7389 

0.2864 

0.0479 

0.0034 

0.0001 

0.0000 

0.0000 

23 

1.0000 

1.0000 

1.0000 

0.9881 

0.8109 

0.3711 

0.0755 

0.0066 

0.0003 

0.0000 

0.0000 

24 

1.0000 

1.0000 

1.0000 

0.9939 

0.8686 

0.4617 

0.1136 

0.0121 

0.0006 

0.0000 

0.0000 

25 

1.0000 

1.0000 

1.0000 

0.9970 

0.9125 

0.5535 

0.1631 

0.0211 

0.0012 

0.0000 

0.0000 

26 

1.0000 

1 .0000 

1.0000 

0.9986 

0.9442 

0.6417 

0.2244 

0.0351 

0.0024 

0.0001 

0.0000 

27 

1.0000 

1.0000 

1.0000 

0.9994 

0.9658 

0.7224 

0.2964 

0.0558 

0.0046 

0.0002 

0.0000 

28 

1.0000 

1.0000 

1.0000 

0.9997 

0.9800 

0.7925 

0.3768 

0.0848 

0.0084 

0.0004 

0.0000 

29 

1.0000 

1.0000 

1.0000 

0.9999 

0.9888 

0.8505 

0.4623 

0.1236 

0.0148 

0.0008 

0.0000 

30 

1.0000 

1 .0000 

1.0000 

1.0000 

0.9939 

0.8962 

0.5491 

0.1730 

0.0248 

0.0015 

0.0000 

31 

1.0000 

1.0000 

1.0000 

1.0000 

0.9969 

0.9307 

0.6331 

0.2331 

0.0398 

0.0030 

0.0001 

32 

1.0000 

1.0000 

1.0000 

1.0000 

0.9984 

0.9554 

0.7107 

0.3029 

0.0615 

0.0055 

0.0002 

33 

1.0000 

1.0000 

1.0000 

1.0000 

0.9993 

0.9724 

0.7793 

0.3803 

0.0913 

0.0098 

0.0004 

34 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9836 

0.8371 

0.4624 

0.1303 

0.0166 

0.0009 

35 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9906 

0.8839 

0.5458 

0.1795 

0.0272 

0.0018 

36 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9948 

0,9201 

0.6269 

0.2386 

0.0429 

0.0033 

37 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9973 

0.9470 

0.7024 

0.3068 

0.0651 

0.0060 

38 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9986 

0.9660 

0.7699 

0.3822 

0.0951 

0.0105 

39 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9993 

0.9790 

0.8276 

0.4621 

0.1343 

0.0176 

40 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9875 

0.8750 

0.5433 

0.1831 

0.0284 

41 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9928 

0.9123 

0.6225 

0.2415 

0.0443 

42 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9960 

0.9406 

0.6967 

0.3087 

0.0666 

43 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9979 

0.9611 

0.7635 

0.3828 

0.0967 

44 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9989 

0.9754 

0.8211 

0.4613 

0.1356 

45 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9850 

0.8689 

0.5413 

0.1841 

46 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9997 

0.9912 

0.9070 

0.6196 

0.2421 

47 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9950 

0.9362 

0.6931 

0.3086 

48 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9973 

0.9577 

0.7596 

0.3822 

49 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9985 

0.9729 

0.8173 

0.4602 

50 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9993 

0.9832 

0.8654 

0.5398 


598 estadi'stica aplicada a LOS negocios y la economi'a 


Tabla C Distribution binomial acumulada (continuation) 


n X 

t r 

0.01 

0.05 

0.10 

0.15 

0.20 

0.25 

0.30 

0.35 

0.40 

0.45 

0.50 

51 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9900 

0.9040 

0.6178 

52 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9942 

0.9338 

0.6914 

53 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9968 

0,9559 

0.7579 

54 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9983 

0.9716 

0.8159 

55 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9991 

0.9824 

0.8644 

56 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

0.9894 

0.9033 

57 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9939 

0.9334 

58 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9966 

0.9557 

59 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9982 

0.9716 

60 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9991 

0.9824 

61 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9995 

0.9895 

62 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

0.9940 

63 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

0.9967 

64 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9982 

65 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9991 

66 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9996 

67 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9998 

68 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

0.9999 

69 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 



Tabla D Distribucion de Poissson 
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Tabla D Distribution de Poissson (continuation) 



M 

jr 

5.1 

5.2 

5.3 

5.4 

5.5 

5.6 

5.7 

5.8 

5.9 

6.0 

14 

0.0006 

0.0007 

0.0008 

0.0009 

0.0011 

0.0013 

0.0015 

0.0017 

0.0019 

0.0022 

15 

0.0002 

0.0002 

0.0003 

0.0003 

0.0004 

0.0005 

0.0006 

0.0007 

0.0008 

0.0009 

16 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0002 

0.0002 

0.0002 

0.0003 

0.0003 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 



X 

6.1 

6.2 

6.3 

6.4 

6.5 

6.6 

6.7 

6.8 

6.9 

7.0 

0 

0.0022 

0.0020 

0.0018 

0.0017 

0.0015 

0.0014 

0.0012 

0.0011 

0.0010 

0.0009 

1 

0.0137 

0.0126 

0.0116 

0.0106 

0.0098 

0.0090 

0.0082 

0.0076 

0.0070 

0.0064 

2 

0.0417 

0.0390 

0.0364 

0.0340 

0.0318 

0.0296 

0.0276 

0.0258 

0.0240 

0.0223 

3 

0.0848 

0.0806 

0.0765 

0.0726 

0.0688 

0.0652 

0.0617 

0.0584 

0.0552 

0.0521 

4 

0.1294 

0.1249 

0.1205 

0.1162 

0.1118 

0.1076 

0.1034 

0.0992 

0.0952 

0.0912 

5 

0.1579 

0.1549 

0.1519 

0.1487 

0.1454 

0.1420 

0.1385 

0.1349 

0.1314 

0.1277 

6 

0.1605 

0.1601 

0.1595 

0.1586 

0.1575 

0.1562 

0.1546 

0.1529 

0.1511 

0.1490 

7 

0.1399 

0.1418 

0.1435 

0.1450 

0.1462 

0.1472 

0.1480 

0.1486 

0.1489 

0.1490 

8 

0.1066 

0.1099 

0.1130 

0.1160 

0.1188 

0.1215 

0.1240 

0.1263 

0.1284 

0.1304 

9 

0.0723 

0.0757 

0.0791 

0.0825 

0.0858 

0.0891 

0.0923 

0.0954 

0.0985 

0.1014 

10 

0.0441 

0.0469 

0.0498 

0.0528 

0.0558 

0.0588 

0.0618 

0.0649 

0.0679 

0.0710 

11 

0.0244 

0.0265 

0.0285 

0.0307 

0.0330 

0.0353 

0.0377 

0.0401 

0.0426 

0.0452 

12 

0.0124 

0.0137 

0.0150 

0.0164 

0.0179 

0.0194 

0.0210 

0.0227 

0.0245 

0.0263 

13 

0.0058 

0.0065 

0.0073 

0.0081 

0.0089 

0.0099 

0.0108 

0.0119 

0.0130 

0.0142 

14 

0.0025 

0.0029 

0.0033 

0.0037 

0.0041 

0.0046 

0.0052 

0.0058 

0.0064 

0.0071 

15 

0.0010 

0.0012 

0.0014 

0.0016 

0.0018 

0.0020 

0.0023 

0.0026 

0.0029 

0.0033 

16 

0.0004 

0.0005 

0.0005 

0.0006 

0.0007 

0.0008 

0.0010 

0.0011 

0.0013 

0.0014 

17 

0.0001 

0.0002 

0.0002 

0.0002 

0.0003 

0.0003 

0.0004 

0.0004 

0.0005 

0.0006 

18 

0.0000 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0002 

0.0002 

0.0002 

19 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0001 

0.0001 

0.0001 


X 


7.1 

7.2 

7.3 

7.4 

7.5 

7.6 

7.7 

7.8 

7.9 

8.0 

0 

0.0008 

0.0007 

0.0007 

0.0006 

0.0006 

0.0005 

0.0005 

0.0004 

0.0004 

0.0003 

1 

0.0059 

0.0054 

0.0049 

0.0045 

0.0041 

0.0038 

0.0035 

0.0032 

0.0029 

0.0027 

2 

0.0208 

0.0194 

0.0180 

0.0167 

0.0156 

0.0145 

0.0134 

0.0125 

0.0116 

0.0107 

3 

0.0492 

0.0464 

0.0438 

0.0413 

0.0389 

0.0366 

0.0345 

0.0324 

0.0305 

0.0286 

4 

0.0874 

0.0836 

0.0799 

0.0764 

0.0729 

0.0696 

0.0663 

0.0632 

0.0602 

0.0573 

5 

0.1241 

0.1204 

0.1167 

0.1130 

0.1094 

0.1057 

0.1021 

0.0986 

0.0951 

0.0916 

6 

0.1468 

0.1445 

0.1420 

0.1394 

0.1367 

0.1339 

0.1311 

0.1282 

0.1252 

0.1221 

7 

0.1489 

0.1486 

0.1481 

0.1474 

0.1465 

0.1454 

0.1442 

0.1428 

0.1413 

0.1396 

8 

0.1321 

0.1337 

0.1351 

0.1363 

0.1373 

0.1381 

0.1388 

0.1392 

0.1395 

0.1396 

9 

0.1042 

0.1070 

0.1096 

0.1121 

0.1144 

0.1167 

0.1187 

0.1207 

0.1224 

0.1241 

10 

0.0740 

0.0770 

0.0800 

0.0829 

0.0858 

0.0887 

0.0914 

0.0941 

0.0967 

0.0993 

11 

0.0478 

0.0504 

0.0531 

0.0558 

0.0585 

0.0613 

0.0640 

0.0667 

0.0695 

0.0722 

12 

0.0283 

0.0303 

0.0323 

0.0344 

0.0366 

0.0388 

0.0411 

0.0434 

0.0457 

0.0481 

13 

0.0154 

0.0168 

0.0181 

0.0196 

0.0211 

0.0227 

0.0243 

0.0260 

0.0278 

0.0296 

14 

0.0078 

0.0086 

0.0095 

0.0104 

0.0113 

0.0123 

0.0134 

0.0145 

0.0157 

0.0169 



X 

8.1 

8.2 

8.3 

8.4 

8.5 

8.6 

8.7 

8.8 

8.9 

9.0 

0 

0.0003 

0.0003 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0001 

0.0001 

1 

0.0025 

0.0023 

0.0021 

0.0019 

0.0017 

0.0016 

0.0014 

0.0013 

0.0012 

0.0011 

2 

0.0100 

0.0092 

0.0086 

0.0079 

0.0074 

0.0068 

0.0063 

0.0058 

0.0054 

0.0050 

3 

0.0269 

0.0252 

0.0237 

0.0222 

0.0208 

0.0195 

0.0183 

0.0171 

0.0160 

0.0150 

4 

0.0544 

0.0517 

0.0491 

0.0466 

0.0443 

0.0420 

0.0398 

0.0377 

0.0357 

0.0337 

5 

0.0882 

0.0849 

0.0816 

0.0784 

0.0752 

0.0722 

0.0692 

0.0663 

0.0635 

0.0607 

6 

0.1191 

0.1160 

0.1128 

0.1097 

0.1066 

0.1034 

0.1003 

0.0972 

0.0941 

0.0911 

7 

0.1378 

0.1358 

0.1338 

0.1317 

0.1294 

0.1271 

0.1247 

0.1222 

0.1197 

0.1171 

8 

0.1395 

0.1392 

0.1388 

0.1382 

0.1375 

0.1366 

0.1356 

0.1344 

0.1332 

0.1318 

9 

0.1256 

0.1269 

0.1280 

0.1290 

0.1299 

0.1306 

0.1311 

0.1315 

0.1317 

0.1318 

10 

0.1017 

0.1040 

0.1063 

0.1084 

0.1104 

0.1123 

0.1140 

0.1157 

0.1172 

0.1186 

11 

0.0749 

0.0776 

0.0802 

0.0828 

0.0853 

0.0878 

0.0902 

0.0925 

0.0948 

0.0970 

12 

0.0505 

0.0530 

0.0555 

0.0579 

0.0604 

0.0629 

0.0654 

0.0679 

0.0703 

0.0728 

13 

0.0315 

0.0334 

0.0354 

0.0374 

0.0395 

0.0416 

0.0438 

0.0459 

0.0481 

0.0504 

14 

0.0182 

0.0196 

0.0210 

0.0225 

0.0240 

0.0256 

0.0272 

0.0289 

0.0306 

0.0324 

15 

0.0098 

0.0107 

0.0116 

0.0126 

0.0136 

0.0147 

0.0158 

0.0169 

0.0182 

0.0194 

16 

0.0050 

0.0055 

0.0060 

0.0066 

0.0072 

0.0079 

0.0086 

0.0093 

0.0101 

0.0109 

17 

0.0024 

0.0026 

0.0029 

0.0033 

0.0036 

0.0040 

0.0044 

0.0048 

0.0053 

0.0058 

18 

0.0011 

0.0012 

0.0014 

0.0015 

0.0017 

0.0019 

0.0021 

0.0024 

0.0026 

0.0029 

19 

0.0005 

0.0005 

0.0006 

0.0007 

0.0008 

0.0009 

0.0010 

0.0011 

0.0012 

0.0014 

20 

0.0002 

0.0002 

0.0002 

0.0003 

0.0003 

0.0004 

0.0004 

0.0005 

0.0005 

0.0006 

21 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0002 

0.0002 

0.0002 

0.0002 

0.0003 

22 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 
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Tabla D Distribution de Poissson (continuacion) 



M 

X 

9.1 

9.2 

9.3 

9.4 

9.5 

9.6 

9.7 

9.8 

9.9 

10.0 

8 

0.1302 

0.1286 

0.1269 

0.1251 

0.1232 

0.1212 

0.1191 

0.1170 

0.1148 

0.1126 

9 

0.1317 

0.1315 

0.1311 

0.1306 

0.1300 

0.1293 

0.1284 

0.1274 

0.1263 

0.1251 

10 

0.1198 

0.1210 

0.1219 

0.1228 

0.1235 

0.1241 

0.1245 

0.1249 

0.1250 

0.1251 

11 

0.0991 

0.1012 

0.1031 

0.1049 

0.1067 

0.1083 

0.1098 

0.1112 

0.1125 

0.1137 

12 

0.0752 

0.0776 

0.0799 

0.0822 

0.0844 

0.0866 

0.0888 

0.0908 

0.0928 

0.0948 

13 

0.0526 

0.0549 

0.0572 

0.0594 

0.0617 

0.0640 

0.0662 

0.0685 

0.0707 

0.0729 

14 

0.0342 

0.0361 

0.0380 

0.0399 

0.0419 

0.0439 

0.0459 

0.0479 

0.0500 

0.0521 

15 

0.0208 

0.0221 

0.0235 

0.0250 

0.0265 

0.0281 

0.0297 

0.0313 

0.0330 

0.0347 

16 

0.0118 

0.0127 

0.0137 

0.0147 

0.0157 

0.0168 

0.0180 

0.0192 

0.0204 

0.0217 

17 

0.0063 

0.0069 

0.0075 

0.0081 

0.0088 

0.0095 

0.0103 

0.0111 

0.0119 

0.0128 

18 

0.0032 

0.0035 

0.0039 

0.0042 

0.0046 

0.0051 

0.0055 

0.0060 

0.0065 

0.0071 

19 

0.0015 

0.0017 

0.0019 

0.0021 

0.0023 

0.0026 

0.0028 

0.0031 

0.0034 

0.0037 

20 

0.0007 

0.0008 

0.0009 

0.0010 

0.0011 

0.0012 

0.0014 

0.0015 

0.0017 

0.0019 

21 

0.0003 

0.0003 

0.0004 

0.0004 

0.0005 

0.0006 

0.0006 

0.0007 

0.0008 

0.0009 

22 

0.0001 

0.0001 

0.0002 

0.0002 

0.0002 

0.0002 

0.0003 

0.0003 

0.0004 

0.0004 

23 

0.0000 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0002 

0.0002 

24 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0001 

0.0001 


M 

X 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

0 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

1 

0.0002 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

2 

0.0010 

0.0004 

0.0002 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

3 

0.0037 

0.0018 

0.0008 

0.0004 

0.0002 

0.0001 

0.0000 

0.0000 

0.0000 

0.0000 

4 

0.0102 

0.0053 

0.0027 

0.0013 

0.0006 

0.0003 

0.0001 

0.0001 

0.0000 

0.0000 

5 

0.0224 

0.0127 

0.0070 

0.0037 

0.0019 

0.0010 

0.0005 

0.0002 

0.0001 

0.0001 

6 

0.0411 

0.0255 

0.0152 

0.0087 

0.0048 

0.0026 

0.0014 

0.0007 

0.0004 

0.0002 

7 

0.0646 

0.0437 

0.0281 

0.0174 

0.0104 

0.0060 

0.0034 

0.0019 

0.0010 

0.0005 

8 

0.0888 

0.0655 

0.0457 

0.0304 

0.0194 

0.0120 

0.0072 

0.0042 

0.0024 

0.0013 

9 

0.1085 

0.0874 

0.0661 

0.0473 

0.0324 

0.0213 

0.0135 

0.0083 

0.0050 

0.0029 

10 

0.1194 

0.1048 

0.0859 

0.0663 

0.0486 

0.0341 

0.0230 

0.0150 

0.0095 

0.0058 

11 

0.1194 

0.1144 

0.1015 

0.0844 

0.0663 

0.0496 

0.0355 

0.0245 

0.0164 

0.0106 

12 

0.1094 

0.1144 

0.1099 

0.0984 

0.0829 

0.0661 

0.0504 

0.0368 

0.0259 

0.0176 

13 

0.0926 

0.1056 

0.1099 

0.1060 

0.0956 

0.0814 

0.0658 

0.0509 

0.0378 

0.0271 

14 

0.0728 

0.0905 

0.1021 

0.1060 

0.1024 

0.0930 

0.0800 

0.0655 

0.0514 

0.0387 

15 

0.0534 

0.0724 

0.0885 

0.0989 

0.1024 

0.0992 

0.0906 

0.0786 

0.0650 

0.0516 

16 

0.0367 

0.0543 

0.0719 

0.0866 

0.0960 

0.0992 

0.0963 

0.0884 

0.0772 

0.0646 

17 

0.0237 

0.0383 

0.0550 

0.0713 

0.0847 

0.0934 

0.0963 

0.0936 

0.0863 

0.0760 

18 

0.0145 

0.0255 

0.0397 

0.0554 

0.0706 

0.0830 

0.0909 

0.0936 

0.0911 

0.0844 

19 

0.0084 

0.0161 

0.0272 

0.0409 

0.0557 

0:0699 

0.0814 

0.0887 

0.0911 

0.0888 

20 

0.0046 

0.0097 

0.0177 

0.0286 

0.0418 

0.0559 

0.0692 

0.0798 

0.0866 

0.0888 

21 

0.0024 

0.0055 

0.0109 

0.0191 

0.0299 

0.0426 

0.0560 

0.0684 

0.0783 

0.0846 

22 

0.0012 

0.0030 

0.0065 

0.0121 

0.0204 

0.0310 

0.0433 

0.0560 

0.0676 

0.0769 

23 

0.0006 

0.0016 

0.0037 

0.0074 

0.0133 

0.0216 

0.0320 

0.0438 

0.0559 

0.0669 
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Tabla D Distribution de Poissson (continuation) 





APEND1CE 111 • Tablas estadisticas 0Q5 


P{ 0< Z< 1.96) = 0.4750 



1.96 Z 


Tabla E Distribueion normal 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.0000 

0.0040 

0.0080 

0.0120 

0.0160 

0.0199 

0.0239 

0.0279 

0.0319 

0.0359 

0.1 

0.0398 

0.0438 

0.0478 

0.0517 

0.0557 

0.0596 

0.0636 

0.0675 

0.0714 

0.0753 

0.2 

0.0793 

0.0832 

0.0871 

0.0910 

0.0948 

0.0987 

0.1026 

0.1064 

0.1103 

0.1141 

0.3 

0.1179 

0.1217 

0.1255 

0.1293 

0.1331 

0.1368 

0.1406 

0.1443 

0.1480 

0.1517 

0.4 

0.1554 

0.1591 

0.1628 

0.1664 

0.1700 

0.1736 

0.1772 

0.1808 

0.1844 

0.1879 

0.5 

0.1915 

0.1950 

0.1985 

0.2019 

0.2054 

0.2088 

0.2123 

0.2157 

0.2190 

0.2224 

0.6 

0.2257 

0.2291 

0.2324 

0.2357 

0.2389 

0.2422 

0.2454 

0.2486 

0.2517 

0.2549 

0.7 

0.2580 

0.2611 

0.2642 

0.2673 

0.2704 

0.2734 

0.2764 

0.2794 

0.2823 

0.2852 

0.8 

0.2881 

0.2910 

0.2939 

0.2967 

0.2995 

0.3023 

0.3051 

0.3078 

0.3106 

0.3133 

0.9 

0.3159 

0.3186 

0.3212 

0.3238 

0.3264 

0.3289 

0.3315 

0.3340 

0.3365 

0.3389 

1.0 

0.3413 

0.3438 

0.3461 

0.3485 

0.3508 

0.3531 

0.3554 

0.3577 

0.3599 

0.3621 

1.1 

0.3643 

0.3665 

0.3686 

0.3708 

0.3729 

0.3749 

0.3770 

0.3790 

0.3810 

0.3830 

1.2 

0.3849 

0.3869 

0.3888 

0.3907 

0.3925 

0.3944 

0.3962 

0.3980 

0.3997 

0.4015 

1.3 

0.4032 

0.4049 

0.4066 

0.4082 

0.4099 

0.4115 

0.4131 

0.4147 

0.4162 

0.4177 

1.4 

0.4192 

0.4207 

0.4222 

0.4236 

0.4251 

0.4265 

0.4279 

0.4292 

0.4306 

0.4319 

1.5 

I 0.4332 


0.4357 

0.4370 

0.4382 

0.4394 


in 


0.4441 

1.6 

0.4452 

0.4463 


0.4484 




msm 

0.4535 

0.4545 

1.7 




0.4582 

0.4591 

mm 


0.4616 



1.8 

mm 

0.4649 



0.4671 

0.4678 


0.4693 

Mum 

0.4706 

1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 

0.4750 

0.4756 

0.4761 

0.4767 

2.0 

0.4772 

0.4778 

0.4783 

0.4788 

0.4793 

0.4798 

0.4803 

0.4808 

0.4812 

0.4817 

2.1 

0.4821 

0.4826 

0.4830 

0.4834 

0.4838 

0.4842 

0.4846 

0.4850 

0.4854 

0.4857 

2.2 

0.4861 

0.4864 

0.4868 

0.4871 

0.4875 

0.4878 

0.4881 

0.4884 

0.4887 

0.4890 

2.3 

0.4893 

0.4896 

0.4898 

0.4901 

0.4904 

0.4906 

0.4909 

0.4911 

0.4913 

0.4916 

2.4 

0.4918 

0.4920 

0.4922 

0.4925 

0.4927 

0.4929 

0.4931 

0.4932 

0.4934 

0.4936 

2.5 

0.4938 

0.4940 

0.4941 

0.4943 

0.4945 

0.4946 

0.4948 

0.4949 

0.4951 

0.4952 

2.6 

0.4953 

0.4955 

0.4956 

0.4957 

0.4959 

0.4960 

0.4961 

0.4962 

0.4963 

0.4964 

2.7 ! 

0.4965 

0.4966 

0.4967 

0.4968 

0.4969 

0.4970 

0.4971 

0.4972 

0.4973 

0.4974 

2.8 

0.4974 

0.4975 

0.4976 

0.4977 

0.4977 

0.4978 

0.4979 

0.4979 

0.4980 

0.4981 

2.9 

0.4981 

0.4982 

0.4982 

0.4983 

0.4984 

0.4984 

0.4985 

0.4985 

0.4986 

0.4986 

3.0 

0.4987 

0.4987 

0.4987 

0.4988 

0.4988 

0.4989 

0.4989 

0.4989 

0.4990 

0.4990 

3.1 

0.4990 

0.4991 

0.4991 

0.4991 

0.4992 

0.4992 

0.4992 

0.4992 

0.4993 

0.4993 

3.2 

0.4993 

0.4993 

0.4994 

0.4994 

0.4994 

0.4994 

0.4994 

0.4995 

0.4995 

0.4995 

3.3 

0.4995 

0.4995 

0.4995 

0.4996 

0.4996 

0.4996 

0.4996 

0.4996 

0.4996 

0.4997 

3.4 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4998 

3.5 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4498 

3.6 

0.4998 

0.4998 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.7 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.8 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.9 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 
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Tabla F Distribucion t 



■ , 

0.700 

0.500 

0.300 

0,200 

0.100 

0.050 

0.020 

0.010 

Valor a 

1 Prueba 


■MljI 

0.300 

0.500 

0.700 

0.800 

0.900 

0.950 

0.980 

0.990 

1 C 

j de dos colas 



0.350 

0.250 

0.150 

0.100 

0.050 

0.025 

0.010 

0.005 

Valor a 

1 Prueba 



0.650 

0.750 

0.850 

0.900 

0.950 

0.975 

0.990 

0.995 

1 C 

J de una cola 

0.1. 

Valores de / 



1 

0.158 

0.510 

1.000 

1.963 

3.078 

6.314 

12.706 

31.821 

63.657 



2 

0.142 

0.445 

0.816 

1.386 

1,886 

2.920 

4.303 

6.965 

9.925 



3 

0.137 

0.424 

0.765 

1.250 

1.638 

2.353 

3.182 

4.541 

5.841 



4 

0.134 

0.414 

0.741 

1.190 

1.533 

2.132 

2.776 

3.747 

4.604 



5 

0.132 

0.408 

0.727 

1.156 

1.476 

2.015 

2.571 

3.365 

4.032 



6 

0.131 

0.404 

0.718 

1.134 

1.440 

1.943 

2.447 

3.143 

3.707 



7 

0.130 

0.402 

0.711 

1.119 

1.415 

1.895 

2.365 

2.998 

3.499 



8 

0.130 

0.399 

0.706 

1.108 

1.397 

1.860 

2.306 

2.896 

3.355 



9 

0.129 

0.398 

0.703 

1.100 

1.383 

1.833 

2.262 

2.821 

3.250 



10 

0.129 

0.397 

0.700 

1.093 

1.372 

1.812 

2.228 

2.764 

3.169 



11 

0.129 

0.396 

0.697 

1.088 

1.363 

1.796 

2.201 

2.718 

3.106 



12 

0.128 

0.395 

0.695 

1.083 

1.356 

1.782 

2.179 

2.681 

3.055 



13 

0.128 

0.394 

0.694 

1.079 

1.350 

1.771 

2.160 

2.650 

3.012 



14 

0.128 

0.393 

0.692 

1.076 

1.345 

1.761 

2.145 

2.624 

2.977 



15 

0.128 

0.393 

0.691 

1.074 

1.341 

1.753 

2.131 

2.602 

2.947 



16 

0.128 

0.392 

0.690 

1.071 

1.337 

1.746 

2.120 

2.583 

2.921 



17 

0.128 

0.392 

0.689 

1.069 

1.333 

1.740 

2.110 

2.567 

2.898 



18 

0.127 

0.392 

0.688 

1.067 

1.330 

1.734 

2.101 

2.552 

2.878 



19 

0.127 

0.391 

0.688 

1.066 

1.328 

1.729 

2.093 

2.539 

2.861 



20 

0.127 

0.391 

0.687 

1.064 

1.325 

1.725 

2.086 

2.528 

2.845 



21 

0.127 

0.391 

0.686 

1.063 

1.323 

1.721 

2.080 

2.518 

2.831 



22 

0.127 

0.390 

0.686 

1.061 

1.321 

1.717 

2.074 

2.508 

2.819 



23 

0.127 

0.390 

0.685 

1.060 

1.319 

1.714 

2.069 

2.500 

2.807 



24 

0.127 

0.390 

0.685 

1.059 

1.318 

1.711 

2.064 

2.492 

2.797 



25 

0.127 

0.390 

0.684 

1.058 

1.316 

1.708 

2.060 

2.485 

2.787 



26 

0.127 

0,390 

0.684 

1.058 

1.315 

1.706 

2.056 

2.479 

2.779 



27 

0.127 

0.389 

0.684 

1.057 

1.314 

1.703 

2.052 

2.473 

2.771 



28 

0.127 

0.389 

0.683 

1.056 

1.313 

1.701 

2.048 

2.467 

2.763 



29 

0.127 

0.389 

0.683 

1.055 

1.311 

1.699 

2.045 

2.462 

2.756 




0.127 

0.389 

0.683 

1.055 

1.310 

1.697 

2.042 

2.457 

2.750 




0.126 

0.388 

0.681 

1.050 

1.303 

1.684 

2.021 

2.423 

2.704 



60 

0.126 

0.387 

0.679 

1.045 

1.296 

1.671 

2.000 

2.390 

2.660 



120 

0.126 

0.386 

0.677 

1.041 

1.289 

1.658 

1.980 

2.358 

2.617 



00 

0.126 

0.385 

0.674 

1.036 

1.282 

1.645 

1.960 

2.326 

2.576 






APENDICE III • Tablas estadisticas 0Q7 



Tabla G Distribution F 



F [ 3 ggi OL — 0.10 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

1 

39.86 

49.50 

53.59 

55.83 

57.24 

58.20 

58.91 

59.44 

59.86 

2 

8.53 

9.00 

9.16 

9.24 

9.29 

9.33 

9.35 

9.37 

9.38 

3 

5.54 

5.46 

5.39 

5.34 

5.31 

5.28 

5.27 

5.25 

5.24 

4 

4.54 

4.32 

4.19 

4.11 

4.05 

4.01 

3.98 

3.95 

3.94 

5 

4.06 

3.78 

3.62 

3.52 

3.45 

3.40 

3.37 

3.34 

3.32 

6 

3.78 

3.46 

3.29 

3.18 

3.11 

3.05 

3.01 

2.98 

2.96 

7 

3.59 

3.26 

3.07 

2.96 

2.88 

2.83 

2.78 

2.75 

2.72 

8 

3.46 

3.11 

2.92 

2.81 

2.73 

2.67 

2.62 

2.59 

2.56 

9 

3.36 

3.01 

2.81 

2.69 

2.61 

2.55 

2.51 

2.47 

2.44 

10 

3.29 

2.92 

2.13 

2.61 

2.52 

2.46 

2.41 

2.38 

2.35 

11 

3.23 

2.86 

2.66 

2.54 

2.45 

2.39 

2.34 

2.30 

2.27 

12 

3.18 

2.81 

2.61 

2.48 

2.39 

2.33 

2.28 

2.24 

2.21 

13 

3.14 

2.76 

2.56 

2.43 

2.35 

2.28 

2.23 

2.20 

2.16 

14 

3.10 

2.73 

2.52 

2.39 

2.31 

2.24 

2.19 

2.15 

2.12 

15 

3.07 

2.70 

2.49 

2.36 

2.27 

2.21 

2.16 

2.12 

2.09 

16 

3.05 

2.67 

2.46 

2.33 

2.24 

2.18 

2.13 

2.09 

2.06 

17 

3.03 

2.64 

2.44 

2.31 

2.22 

2.15 

2.10 

2.06 

2.03 

18 

3.01 

2.62 

2.42 

2.29 

2.20 

2.13 

2.08 

2.04 

2.00 

19 

2.99 

2.61 

2.40 

2.27 

2.18 

2.11 

2.06 

2.02 

1.98 

20 

2.97 

2.59 

2.38 

2.25 

2.16 

2.09 

2.04 

2.00 

1.96 

21 

2.96 

2.57 

2.36 

2.23 

2.14 

2.08 

2.02 

1.98 

1.95 

22 

2.95 

2.56 

2.35 

2.22 

2.13 

2.06 

2.01 

1.97 

1.93 

23 

2.94 

2.55 

2.34 

2.21 

2.11 

2.05 

1.99 

1.95 

1.92 

24 

2.93 

2.54 

2.33 

2.19 

2.10 

2.04 

1.98 

1.94 

1.91 

25 

2.92 

2.53 

2.32 

2.18 

2.09 

2.02 

1.97 

1.93 

1.89 

26 

2.91 

2.52 

2.31 

2.17 

2.08 

2.01 

1.96 

1.92 

1.88 

27 

2.90 

2.51 

2.30 

2.17 

2.07 

2.00 

1.95 

1.91 

1.87 

28 

2.89 

2.50 

2.29 

2.16 

2.06 

2.00 

1.94 

1.90 

1.87 

29 

2.89 

2.50 

2.28 

2.15 

2.06 

1.99 

1.93 

1.89 

1.86 

30 

2.88 

2.49 

2.28 

2.14 

2.05 

1.98 

1.93 

1.88 

1.85 

40 

2.84 

2.44 

2.23 

2.09 

2.00 

1.93 

1.87 

1.83 

1.79 

60 

2.79 

2.39 

2.18 

2.04 

1.95 

1.87 

1.82 

1.77 

1.74 

120 

2.75 

2.35 

2.13 

1.99 

1.90 

1.82 

1.77 

1.72 

1.68 

00 

2.71 

2.30 

2.08 

1.95 

1.85 

1.77 

1.72 

1.67 

1.63 



608 ESTADISTICA apucada a LOS negocios y IA ECONOMIA 


Tabla G Distribution F (continuation) 


F ot - 0.10 


Grados Grados de libertad del numerador 

de libertad 


del denominador 

10 

12 

15 

20 

24 

30 

40 

60 

120 

oc 

1 

60.19 

60.71 

61.22 

61.74 

62.00 

62.26 

62.53 

62.79 

63.06 

63.33 

2 

9.39 

9.41 

9.42 

9.44 

9.45 

9.46 

9.47 

9.47 

9.48 

9.49 

3 

5.23 

5.22 

5.20 

5.18 

5.18 

5.17 

5.16 

5.15 

5.14 

5.13 

4 

3.92 

3.90 

3.87 

3.84 

3.83 

3.82 

3.80 

3.79 

3.78 

3.76 

5 

3.30 

3.27 

3.24 

3.21 

3.19 

3.17 

3.16 

3.14 

3.12 

3.11 

6 

2.94 

2.90 

2.87 

2.84 

2.82 

2.80 

2.78 

2.76 

2.74 

2.72 

7 

2.70 

2.67 

2.63 

2.59 

2.58 

2.56 

2.54 

2.51 

2.49 

2.47 

8 

2.54 

2.50 

2.46 

2.42 

2.40 

2.38 

2.36 

2.34 

2.32 

2.29 

9 

2.42 

2.38 

2.34 

2.30 

2.28 

2.25 

2.23 

2.21 

2.18 

2.16 

10 

2.32 

2.28 

2.24 

2.20 

2.18 

2.16 

2.13 

2.11 

2.08 

2.06 

11 

2.25 

2.21 

2.17 

2.12 

2.10 

2.08 

2.05 

2.03 

2.00 

1.97 

12 

2.19 

2.15 

2.10 

2.06 

2.04 

2.01 

1.99 

1.96 

1.93 

1.90 

13 

2.14 

2.10 

2.05 

2.01 

1.98 

1.96 

1.93 

1.90 

1.88 

1.85 

14 

2.10 

2.05 

2.01 

1.96 

1.94 

1.91 

1.89 

1.86 

1.83 

1.80 

15 

2.06 

2.02 

1.97 

1.92 

1.90 

1.87 

1.85 

1.82 

1.79 

1.76 

16 

2.03 

1.99 

1.94 

1.89 

1.87 

1.84 

1.81 

1.78 

1.75 

1.72 

17 

2.00 

1.96 

1.91 

1.86 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

18 

1.98 

1.93 

1.89 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

1.66 

19 

| 1.96 

1.91 

1.86 

1.81 

1.79 

1.76 

1.73 

1.70 

1.67 

1.63 

20 

1.94 

1.89 

1.84 

1.79 

1.77 

1.74 

1.71 

1.68 

1.64 

1.61 

21 

1.92 

1.87 

1.83 

1.78 

1.75 

1.72 

1.69 

1.66 

1.62 

1.59 

22 

1.90 

1.86 

1.81 

1.76 

1.73 

1.70 

1.67 

1.64 

1.60 

1.57 

23 

1.89 

1.84 

1.80 

1.74 

1.72 

1.69 

1.66 

1.62 

1.59 

1.55 

24 

1.88 

1.83 

1.78 

1.73 

1.70 

1.67 

1.64 

1.61 

1.57 

1.53 

25 

1.87 

1.82 

1.77 

1.72 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

26 

1.86 

1.81 

1.76 

1.71 

1.68 

1.65 

1.61 

1.58 

1.54 

1..50 

27 

1.85 

1.80 

1.75 

1.70 

1.67 

1.64 

1.60 

1.57 

1,53 

1.49 

28 

1.84 

1.79 

1.74 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

1.48 

29 

1.83 

1.78 

1.73 

1.68 

1.65 

1.62 

1.58 

1.55 

1.51 

1.47 

30 

1.82 

1.77 

1.72 

1.67 

1.64 

1.61 

1.57 

1.54 

1.50 

1.46 

40 

1.76 

1.71 

1.66 

1.61 

1.57 

1.54 

1.51 

1.47 

1.42 

1.38 

60 

1.71 

1.66 

1.60 

1.54 

1.51 

1.48 

1.44 

1.40 

1.35 

1.29 

120 

1.65 

1.60 

1.55 

1.48 

1.45 

1.41 

1.37 

1.32 

1.26 

1.19 

oc 

1.60 

1.55 

1.49 

1.42 

1.38 

1.34 

1.30 

1.24 

1,17 

1.00 






F ).95> 

a = 0.05 





Grados 
de libertad 



Grados de libertad del numerador 



del denominador 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

161.45 

199.50 

215.71 

224.58 

230.16 

233.99 

236.77 

238.88 

240.54 

2 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 

3 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

4 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 



APENDICE III * Tablas estadisticas gQQ 


Tabla G Distribution F (continuation) 



F 0 w ; a = 0.05 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

5 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

6 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

7 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

8 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

9 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

10 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

11 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

12 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

13 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 

14 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

15 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

16 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

17 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 

18 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

19 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

20 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

21 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 

22 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

23 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 

24 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

25 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 

26 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 

27 

4.21 

3.35 

2.96 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 

28 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 

29 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 

30 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

40 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

60 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

120 

3.92 

3.07 

2.68 

2.45 

2.29 

2.18 

2.09 

2.02 

1.96 

00 

3.84 

3.00 

2.61 

2.37 

2.21 

2.10 

2.01 

1.94 

1.88 







^ 0 . 95 ’ a = 

0.05 





Grados 
de libertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

* 

1 

241.88 

243.91 

245.95 

248.01 

249.05 

250.10 

251.14 

252.20 

253.25 

254.31 

2 

19.40 

19.41 

19.43 

19.45 

19.45 

19.46 

19.47 

19.48 

19.49 

19.50 

3 

8.79 

8.74 

8.70 

8.66 

8.64 

8.62 

8.59 

8.57 

8.55 

8.53 

4 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5.69 

5.66 

5.63 

5 

4.74 

4.68 

4.62 

4.56 

4.53 

4.50 

4.46 

4.43 

4.40 

4.37 

6 

4.06 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

3.74 

3.70 

3.67 

7 

3.64 

3.57 

3.51 

3.44 

3.41 

3.38 

3.34 

3.30 

3.27 

3,23 

8 

3.35 

3.28 

3.22 

3.15 

3.12 

3.08 

3.04 

3.01 

2.97 

2.93 

9 

3.14 

3.07 

3.01 

2.94 

2.90 

2.86 

2.83 

2.79 

2.75 

2.71 


gl 0 ESTADiSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMIA 


Tabla G Distribucion F (continuacion) 







^ ). 95 » a - 

0.05 





Grados 
de libertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

Ct 

10 

2.98 

2.91 

2.85 

2.77 

2.74 

2.70 

2.66 

2.62 

2.58 

2.54 

11 

2.85 

2.79 

2.72 

2.65 

2.61 

2.57 

2.53 

2.49 

2.45 

2.40 

12 

2.75 

2.69 

2.62 

2.54 

2.51 

2.47 

2.43 

2.38 

2.34 

2.30 

13 

2.67 

2.60 

2.53 

2.46 

2.42 

2.38 

2.34 

2.30 

2.25 

2.21 

14 

2.60 

2.53 

2.46 

2.39 

2.35 

2.31 

2.27 

2.22 

2.18 

2.13 

15 

2.54 

2.48 

2.40 

2.33 

2.29 

2.25 

2.20 

2.16 

2.11 

2.07 

16 

2.49 

2.42 

2.35 

2.28 

2.24 

2.19 

2.15 

2.11 

2.06 

2.01 

17 

2.45 

2.38 

2.31 

2.23 

2.19 

2.15 

2.10 

2.06 

2.01 

1.96 

18 

2.41 

2.34 

2.27 

2.19 

2.15 

2.11 

2.06 

2.02 

1.97 

1.92 

19 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

1.98 

1.93 

1.88 

20 

2.35 

2.28 

2.20 

2.12 

2.08 

2.04 

1.99 

1.95 

1.90 

1.84 

21 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

1.92 

1.87 

1.81 

22 

2.30 

2.23 

2.15 

2.07 

2.03 

1.98 

1.94 

1.89 

1.84 

1.78 

23 

2.27 

2.20 

2.13 

2.05 

2.01 

1.96 

1.91 

1.86 

1.81 

1.76 

24 

2.25 

2.18 

2.11 

2.03 

1.98 

1.94 

1.89 

1.84 

1.79 

1.73 

25 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.82 

1.77 

1.71 

26 

2.22 

2.15 

2.07 

1.99 

1.95 

1.90 

1.85 

1.80 

1.75 

1.69 

27 

2.20 

2.13 

2.06 

1.97 

1.93 

1.88 

1.84 

1.79 

1.73 

1.67 

28 

2.19 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.77 

1.71 

1.65 

29 

2.18 

2.10 

2.03 

1.94 

1.90 

1.85 

1.81 

1.75 

1.70 

1.64 

30 

2.16 

2.09 

2.01 

1.93 

1.89 

1.84 

1.79 

1.74 

1.68 

1.62 

40 

2.08 

2.00 

1.92 

1.84 

1.79 

1.74 

1.69 

1.64 

1.58 

1.51 

60 

1.99 

1.92 

1.84 

1.75 

1.70 

1.65 

1.59 

1.53 

1.47 

1.39 

120 

1.91 

1.83 

1.75 

1.66 

1.61 

1.55 

1.50 

1.43 

1.35 

1.25 

oc 

1.83 

1.75 

1.67 

1.57 

1.52 

1.46 

1.39 

1.32 

1.22 

1.00 



^ 0 . 975 ; « = 0 025 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

1 

647.8 

799.5 

864.2 

899.6 

921.8 

937.1 

948.2 

956.7 

963.3 

2 

38.51 

39.00 

39.17 

39.25 

39.30 

39.33 

39.36 

39.37 

39.39 

3 

17.44 

16.04 

15.44 

15.10 

14.88 

14.73 

14.62 

14.54 

14.47 

4 

12.22 

10.65 

9.98 

9.60 

9.36 

9.20 

9.07 

8.98 

8.90 

5 

10.01 

8.43 

7.76 

7.39 

7.15 

6.98 

6.85 

6.76 

6.68 

6 

8.81 

7.26 

6.60 

6.23 

5.99 

5.82 

5.70 


5.52 

7 

8.07 

6.54 

5.89 

5.52 

5.29 

5.12 

4.99 

4.90 

4.82 

8 

7.57 

6.06 

5.42 


4.82 

4.65 

4.53 

4.43 

4.36 

9 

7.21 

5.71 

5.08 

4.72 

4.48 

4.32 

4.20 


4.03 

10 

6.94 

5.46 

4.83 

4.47 

4.24 


3.95 

3.85 

3.78 

11 

6.72 

5.26 

4.63 

4.28 


3.88 

3.76 

3.66 

3.59 

12 

6.55 

5.10 

4.47 

4.12 

3.89 

3.73 

3.61 

3.51 

3.44 

13 

6.41 

4.97 

4.35 


3.77 


3.48 

3.39 

3.31 



APENDICE III • Tablas estadisticas g*] 1 


Tabla G Distribution F (continuation) 



^0.975* ® “ 0-025 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

14 

6.30 

4.86 

4.24 

3.89 

3.66 

3.50 

3.38 

3.29 

3.21 

15 

6.20 

4.77 

4.15 

3.80 

3.58 

3.41 

3.29 

3.20 

3.12 

16 

6.12 

4.69 

4.08 

3.73 

3.50 

3.34 

3.22 

3.12 

3.05 

17 

6.04 

4.62 

4.01 

3.66 

3.44 

3.28 

3.16 

3.06 

2.98 

18 

5.98 

4.56 

3.95 

3.61 

3.38 

3.22 

3.10 

3.01 

2.93 

19 

5.92 

4.51 

3.90 

3.56 

3.33 

3.17 

3.05 

2.96 

2.88 

20 

5.87 

4.46 

3.86 

3.51 

3.29 

3.13 

3.01 

2.91 

2.84 

21 

5.83 

4.42 

3.82 

3.48 

3.25 

3.09 

2.97 

2.87 

2.80 

22 

5.79 

4.38 

3.78 

3.44 

3.22 

3.05 

2.93 

2.84 

2.76 

23 

5.75 

4.35 

3.75 

3.41 

3.18 

3.02 

2.90 

2.81 

2.73 

24 

5.72 

4.32 

3.72 

3.38 

3.15 

2.99 

2.87 

2.78 

2.70 

25 

5.69 

4.29 

3.69 

3.35 

3.13 

2.97 

2.85 

2.75 

2.68 

26 

5.66 

4.27 

3.67 

3.33 

3.10 

2.94 

2.82 

2.73 

2.65 

27 

5.63 

4.24 

3.65 

3.31 

3.08 

2.92 

2.80 

2.71 

2.63 

28 

5.61 

4.22 

3.63 

3.29 

3.06 

2.90 

2.78 

2.69 

2.61 

29 

5.59 

4.20 

3.61 

3.27 

3.04 

2.88 

2.76 

2.67 

2.59 

30 

5.57 

4.18 

3.59 

3.25 

3.03 

2.87 

2.75 

2.65 

2.57 

40 

5.42 

4.05 

3.46 

3.13 

2.90 

2.74 

2.62 

2.53 

2.45 

60 

5.29 

3.93 

3.34 

3.01 

2.79 

2.63 

2.51 

2.41 

2.33 

120 

5.15 

3.80 

3.23 

2.89 

2.67 

2.52 

2.39 

2.30 

2.22 

00 

5.02 

3.69 

3.12 

2.79 

2.57 

2.41 

2.29 

2.19 

2.11 







^ 0 . 975 > a 

= 0.025 





Grados 
de libertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

X 

1 

968.6 

976.7 

984.9 

993.1 

997.2 

1001.4 

1005.6 

1009.8 

1014.0 

1018.2 

2 

39.40 

39.41 

39.43 

39.45 

39.46 

39.46 

39.47 

39.48 

39.49 

39.50 

3 

14.42 

14.34 

14.25 

14.17 

14.12 

14.08 

14.04 

13.99 

13.95 

13.90 

4 

8.84 

8.75 

8.66 

8.56 

8.51 

8.46 

8.41 

8.36 

8.31 

8.26 

5 

6.62 

6.52 

6.43 

6.33 

6.28 

6.23 

6.18 

6.12 

6.07 

6.02 

6 

5.46 

5.37 

5.27 

5.17 

5.12 

5.07 

5.01 

4.96 

4.90 

4.85 

7 

4.76 

4.67 

4.57 

4.47 

4.41 

4.36 

4.31 

4.25 

4.20 

4.14 

8 

4.30 

4.20 

4.10 

4.00 

3.95 

3.89 

3.84 

3.78 

3.73 

3.67 

9 

3.96 

3.87 

3.77 

3.67 

3.61 

3.56 

3.51 

3.45 

3.39 

3.33 

10 

3.72 

3.62 

3.52 

3.42 

3.37 

3.31 

3.26 

3.20 

3.14 

3.08 

11 

3.53 

3.43 

3.33 

3.23 

3.17 

3.12 

3.06 

3.00 

2.94 

2.88 

12 

3.37 

3.28 

3.18 

3.07 

3.02 

2.96 

2.91 

2.85 

2.79 

2.73 

13 

3.25 

3.15 

3.05 

2.95 

2.89 

2.84 

2.78 

2.72 

2.66 

2.60 

14 

3.15 

3.05 

2.95 

2.84 

2.79 

2.73 

2.67 

2.61 

2.55 

2.49 

15 

3.06 

2.96 

2.86 

2.76 

2.70 

2.64 

2.59 

2.52 

2.46 

2.40 

16 

2.99 

2.89 

2.79 

2.68 

2.63 

2.57 

2.51 

2.45 

2.38 

2.32 



612 ESTADISTICA APLICADA a LOS NEGOCIOS Y LA ECONOMIA 


Tabla G Distribution F (continuation) 







^J.975> a 

= 0.025 





Grados 
de Eibertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

sc 

17 

2.92 

2.82 

2.72 

2.62 

2.56 

2.50 

2.44 

2.38 

2.32 

2.25 

18 

2.87 

2.77 

2.67 

2.56 

2.50 

2.44 

2.38 

2.32 

2.26 

2.19 

19 

2.82 

2.72 

2.62 

2.51 

2.45 

2.39 

2.33 

2.27 

2.20 

2.13 

20 

2.77 

2.68 

2.57 

2.46 

2.41 

2.35 

2.29 

2.22 

2.16 

2.09 

21 

2.73 

2.64 

2.53 

2.42 

2.37 

2.31 

2.25 

2.18 

2.11 

2.04 

22 

2.70 

2.60 

2.50 

2.39 

2.33 

2.27 

2.21 

2.14 

2.08 

2.00 

23 

2.67 

2.57 

2.47 

2.36 

2.30 

2.24 

2.18 

2.11 

2.04 

1.97 

24 

2.64 

2.54 

2.44 

2.33 

2.27 

2.21 

2.15 

2.08 

2.01 

1.94 

25 

2.61 

2.51 

2.41 

2.30 

2.24 

2.18 

2.12 

2.05 

1.98 

1.91 

26 

2.59 

2.49 

2.39 

2.28 

2.22 

2.16 

2.09 

2.03 

1.95 

1.88 

27 

2.57 

2.47 

2.36 

2.25 

2.19 

2.13 

2.07 

2.00 

1.93 

1.85 

28 

2.55 

2.45 

2.34 

2.23 

2.17 

2.11 

2.05 

1.98 

1.91 

1.83 

29 

2.53 

2.43 

2.32 

2.21 

2.15 

2.09 

2.03 

1.96 

1.89 

1.81 

30 

2.51 

2.41 

2.31 

2.20 

2.14 

2.07 

2.01 

1.94 

1.87 

1.79 

40 

2.39 

2.29 

2.18 

2.07 

2.01 

1.94 

1.88 

1.80 

1.72 

1.64 

60 

2.27 

2.17 

2.06 

1.94 

1.88 

1.82 

1.74 

1.67 

1.58 

1.48 

120 

2.16 

2.05 

1.94 

1.82 

1.76 

1.69 

1.61 

1.53 

1.43 

1.31 

00 

2.05 

1.95 

1.83 

1.71 

1.64 

1.57 

1.48 

1.39 

1.27 

1.00 



F D.gg! ” 0.01 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

1 

4052.2 

4999.5 

5403.4 

5624.6 

5763.6 

5859.0 

5928.4 

5981.1 

6022.5 

2 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 

3 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.67 

27.49 

27.35 

4 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 

5 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 

6 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

8 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

9 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

10 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

11 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

12 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

13 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

14 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 

15 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

16 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

17 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

18 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

19 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 



APENDICE III • Tablas estadisticas 013 


Tabla 6 Distribucion F (continuacion) 



f 0 .»; « = o.oi 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

20 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

21 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 

22 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

23 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 

24 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

25 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 

26 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 

27 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 

28 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 

29 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 

30 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

40 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

60 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

120 

6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 

oc 

6.64 

4.61 

3.78 

3.32 

3.02 

2.80 

2.64 

2.51 

2.41 







a 

= 0.01 





Grados 
de libertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

X 

1 

6055.8 

6106.3 

6157.3 

6208.7 

6234.6 

6260.6 

6286.8 

6313.0 

6339.4 

6365.8 

2 

99.40 

99.42 

99.43 

99.45 

99.46 

99.47 

99.47 

99.48 

99.49 

99.50 

3 

27.23 

27.05 

26.87 

26.69 

26.60 

26.50 

26.41 

26.32 

26.22 

26.13 

4 

14.55 

14.37 

14.20 

14.02 

13.93 

13.84 

13.75 

13.65 

13.56 

13.46 

5 

10.05 

9.89 

9.72 

9.55 

9.47 

9.38 

9.29 

9.20 

9.11 

9.02 

6 

7.87 

8.72 

7.56 

7.40 

7.31 

7.23 

7.14 

7.06 

6.97 

6.88 

7 

6.62 

6.47 

6.31 

6.16 

6.07 

5.99 

5.91 

5.82 

5.74 

5.65 

8 

5.81 

5.67 

5.52 

5.36 

5.28 

5.20 

5.12 

5.03 

4.95 

4.86 

9 

5.26 

5.11 

4.96 

4.81 

4.73 

4.65 

4.57 

4.48 

4.40 

4.31 

10 

4.85 

4.71 

4.56 

4.41 

4.33 

4.25 

4.17 

4.08 

4.00 

3.91 

11 

4.54 

4.40 

4.25 

4.10 

4.02 

3.94 

3.86 

3.78 

3.69 

3.60 

12 

4.30 

4.16 

4.01 

3.86 

3.78 

3.70 

3.62 

3.54 

3.45 

3.36 

13 

4.10 

3.96 

3.82 

3.66 

3.59 

3.51 

3.43 

3.34 

3.25 

3.17 

14 

3.94 

3.80 

3.66 

3.51 

3.43 

3.35 

3.27 

3.18 

3.09 

3.00 

15 

3.80 

3.67 

3.52 

3.37 

3.29 

3.21 

3.13 

3.05 

2.96 

2.87 

16 

3.69 

3.55 

3.41 

3.26 

3.18 

3.10 

3.02 

2.93 

2.84 

2.75 

17 

3.59 

3.46 

3.31 

3.16 

3.08 

3.00 

2.92 

2.83 

2.75 

2.65 

18 

3.51 

3.37 

3.23 

3.08 

3.00 

2.92 

2.84 

2.75 

2.66 

2.57 

19 

3.43 

3.30 

3.15 

3.00 

2.92 

2.84 

2.76 

2.67 

2.58 

2.49 

20 

3.37 

3.23 

3.09 

2.94 

2.86 

2.78 

2.69 

2.61 

2.52 

2.42 

21 

3.31 

3.17 

3.03 

2.88 

2.80 

2.72 

2.64 

2.55 

2.46 

2.36 

22 

3.26 

3.12 

2.98 

2.83 

2.75 

2.67 

2.58 

2.50 

2.40 

2.31 

23 

3.21 

3.07 

2.93 

2.78 

2.70 

2.62 

2.54 

2.45 

2.35 

2.26 

24 

3.17 

3.03 

2.89 

2.74 

2.66 

2.58 

2.49 

2.40 

2.31 

2.21 





014 ESTADI'STICA APLICADA A LOS NEGOCIOSY LA ECONOMIA 


Tabla G Distribution F (continuation) 







^0.99* ® 

0.01 





Grad os 
de libertad 
del denominador 

10 

12 

15 

Grados de libertad del numerador 

20 24 30 40 

60 

120 

X 

25 

3.13 

2.99 

2.85 

2.70 

2.62 

2.54 

2.45 

2.36 

2.27 

2.17 

26 

3.09 

2.96 

2.81 

2.66 

2.58 

2.50 

2.42 

2.33 

2.23 

2.13 

27 

3.06 

2.93 

2.78 

2.63 

2.55 

2.47 

2.38 

2.29 

2.20 

2.10 

28 

3.03 

2.90 

2.75 

2.60 

2.52 

2.44 

2.35 

2.26 

2.17 

2.06 

29 

3.00 

2.87 

2.73 

2.57 

2.49 

2.41 

2.33 

2.23 

2.14 

2.03 

30 

2.98 

2.84 

2.70 

2.55 

2.47 

2.39 

2.30 

2.21 

2.11 

2.01 

40 

2,80 

2.66 

2.52 

2.37 

2.29 

2.20 

2.11 

2.02 

1.92 

1.81 

60 

2.63 

2.50 

2.35 

2.20 

2.12 

2.03 

1.94 

1.84 

1.73 

1.60 

120 

2.47 

2.34 

2.19 

2.03 

1.95 

1.86 

1.76 

1.66 

1.53 

1.38 

X 

2.32 

2.19 

2.04 

1.88 

1.79 

1.70 

1.59 

1.47 

1.33 

1.00 






^0.995’ 

a = 0.005 





Grados 
de libertad 



Grados de libertad del numerador 




del denominador 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

16211 

20000 

21615 

22500 

23056 

23437 

23715 

23925 

24091 

2 

198.50 

199.00 

199.17 

199.25 

199.30 

199.33 

199.36 

199.37 

199.39 

3 

55.55 

49.80 

47.47 

46.19 

45.39 

44.84 

44.43 

44.13 

43.88 

4 

31.33 

26.28 

24.26 

23.15 

22.46 

21.97 

21.62 

21.35 

21.14 

5 

22.78 

18.31 

16.53 

15.56 

14.94 

14.51 

14.20 

13.96 

13.77 

6 

18.63 

14.54 

12.92 

12.03 

11.46 

11.07 

10.79 

10.57 

10.39 

7 

16.24 

12.40 

10.88 

10.05 

9.52 

9.16 

8.89 

8.68 

8.51 

8 

14.69 

11.04 

9.60 

8.81 

8.30 

7.95 

7.69 

7.50 

7.34 

9 

13.61 

10.11 

8.72 

7.96 

7.47 

7.13 

6.88 

6.69 

6.54 

10 

12.83 

9.43 

8.08 

7.34 

6.87 

6.54 

6.30 

6.12 

5.97 

11 

12.23 

8.91 

7.60 

6.88 

6.42 

6.10 

5.86 

5.68 

5.54 

12 

11.75 

8.51 

7.23 

6.52 

6.07 

5.76 

5.52 

5.35 

5.20 

13 

11.37 

8.19 

6.93 

6.23 

5.79 

5.48 

5,25 

5.08 

4.94 

14 

11.06 

7.92 

6.68 

6.00 

5.56 

5.26 

5.03 

4.86 

4.72 

15 

10.80 

7.70 

6.48 

5.80 

5.37 

5.07 

4.85 

4.67 

4.54 

16 

10.58 

7.51 

6.30 

5.64 

5.21 

4.91 

4.69 

4.52 

4.38 

17 

10.38 

7.35 

6.16 

5.50 

5.07 

4.78 

4.56 

4,39 

4.25 

18 

10.22 

7.21 

6.03 

5.37 

4.96 

4.66 

4.44 

4.28 

4.14 

19 

10.07 

7.09 

5.92 

5.27 

4.85 

4.56 

4.34 

4.18 

4.04 

20 

9.94 

6.99 

5.82 

5.17 

4.76 

4.47 

4.26 

4.09 

3.96 

21 

9.83 

6.89 

5.73 

5,09 

4.68 

4.39 

4.18 

4.01 

3.88 

22 

9.73 

6.81 

5.65 

5.02 

4.61 

4.32 

4.11 

3.94 

3,81 

23 

9.63 

6.73 

5.58 

4.95 

4.54 

4.26 

4.05 

3.88 

3.75 

24 

9.55 

6.66 

5.52 

4.89 

4.49 

4.20 

3.99 

3.83 

3.69 

25 

9.48 

6.60 

5,46 

4.84 

4.43 

4.15 

3.94 

3.78 

3.64 

26 

9.41 

6.54 

5.41 

4.79 

4.38 

4.10 

3.89 

3.73 

3.60 

27 

9.34 

6.49 

5.36 

4.74 

4.34 

4,06 

3.85 

3.69 

3.56 

28 

9.28 

6.44 

5.32 

4.70 

4.30 

4.02 

3.81 

3.65 

3.52 

29 

9.23 

6.40 

5.28 

4.66 

4.26 

3.98 

3.77 

3.61 

3.48 



APENDICE III • Tablas estadisticas 0 "| 5 


Tabla G Distribution F (continuation) 



9*>; « = 0005 

Grados 
de libertad 
del denominador 

1 

2 

Grados de libertad del numerador 

3 4 5 6 7 

8 

9 

30 

9.18 

6.35 

5.24 

4.62 

4.23 

3.95 

3.74 

3.58 

3.45 

40 

8.83 

6.07 

4.98 

4.37 

3.99 

3.71 

3.51 

3.35 

3.22 

60 

8.49 

5.79 

4.73 

4.14 

3.76 

3.49 

3.29 

3.13 

3.01 

120 

8.18 

5.54 

4.50 

3.92 

3.55 

3.28 

3.09 

2.93 

2.81 

00 

7.88 

5.30 

4.28 

3.72 

3.35 

3.09 

2.90 

2.75 

2.62 







^*0.985* a Z 

19 





Grados 
de libertad 
del denominador 





60 

120 

3C 

1 

24224 

24426 

24630 

24836 

24940 

25044 

25148 

25253 

25359 

25464 

2 

199.40 

199.42 

199.43 

199.45 

199.46 

199.47 

199.47 

199.48 

199.49 

199.50 

3 

43.69 

43.39 

43.08 

42.78 

42.62 

42.47 

42.31 

42.15 

41.99 

41.83 

4 

20.97 

20.70 

20.44 

20.17 

20.03 

19.89 

19.75 

19.61 

19.47 

19.33 

5 

13.62 

13.38 

13.15 

12.90 

12.78 

12.66 

12.53 

12.40 

12.27 

12.14 

6 

10.25 

10.03 

9.81 

9.59 

9.47 

9.36 

9.24 

9.12 

9.00 

8.88 

7 

8.38 

8.18 

7.97 

7.75 

7.64 

7.53 

7.42 

7.31 

7.19 

7.08 

8 

7.21 

7.01 

6.81 

6.61 

6.50 

6.40 

6.29 

6.18 

6.06 

5.95 

9 

6.42 

6.23 

6.03 

5.83 

5.73 

5.62 

5.52 

5.41 

5.30 

5.19 

10 

5.85 

5.66 

5.47 

5.27 

5.17 

5.07 

4.97 

4.86 

4.75 

4.64 

11 

5.42 

5.24 

5.05 

4.86 

4.76 

4.65 

4.55 

4.45 

4.34 

4.23 

12 

5.09 

4.91 

4.72 

4.53 

4.43 

4.33 

4.23 

4.12 

4.01 

3.90 

13 

4.82 

4.64 

4.46 

4.27 

4.17 

4.07 

3.97 

3.87 

3.76 

3.65 

14 

4.60 

4.43 

4.25 

4.06 

3.96 

3.86 

3.76 

3.66 

3.55 

3.44 

15 

4.42 

4.25 

4.07 

3.88 

3.79 

3.69 

3.58 

3.48 

3.37 

3.26 

16 

4.27 

4.10 

3.92 

3.73 

3.64 

3.54 

3.44 

3.33 

3.22 

3.11 

17 

4.14 

3.97 

3.79 

3.61 

3.51 

3.41 

3.31 

3.21 

3.10 

2.98 

18 

4.03 

3.86 

3.68 

3.50 

3.40 

3.30 

3.20 

3.10 

2.99 

2.87 

19 

3.93 

3.76 

3.59 

3.40 

3.31 

3.21 

3.11 

3.00 

2.89 

2.78 

20 

3.85 

3.68 

3.50 

3.32 

3.22 

3.12 

3.02 

2.92 

2.81 

2.69 

21 

3.77 

3.60 

3.43 

3.24 

3.15 

3.05 

2.95 

2.84 

2.73 

2.61 

22 

3.70 

3.54 

3.36 

3.18 

3.08 

2.98 

2.88 

2.77 

2.66 

2.55 

23 

3.64 

3.47 

3.30 

3.12 

3.02 

2.92 

2.82 

2.71 

2.60 

2.48 

24 

3.59 

3.42 

3.25 

3.06 

2.97 

2.87 

2.77 

2.66 

2.55 

2.43 

25 

3.54 

3.37 

3.20 

3.01 

2.92 

2.82 

2.72 

2.61 

2.50 

2.38 

26 

3.49 

3.33 

3.15 

2.97 

2.87 

2.77 

2.67 

2.56 

2.45 

2.33 

27 

3.45 

3.28 

3.11 

2.93 

2.83 

2.73 

2.63 

2.52 

2.41 

2.29 

28 

3.41 

3.25 

3.07 

2.89 

2.79 

2.69 

2.59 

2.48 

2.37 

2.25 

29 

3.38 

3.21 

3.04 

2.86 

2.76 

2.66 

2.56 

2.45 

2.33 

2.21 

30 

3.34 

3.18 

3.01 

2.82 

2.73 

2.63 

2.52 

2.42 

2.30 

2.18 

40 

3.12 

2.95 

2.78 

2.60 

2.50 

2.40 

2.30 

2.18 

2.06 

1.93 

60 

2.90 

2.74 

2.57 

2.39 

2.29 

2.19 

2.08 

1.96 

1.83 

1.69 

120 

2.71 

2.54 

2.37 

2.19 


1.98 

1.87 

1.75 

1.61 

1.43 

oc 

2.52 

2.36 

2.19 

2.00 

1.90 

1.79 

1.67 

1.53 

1.36 

1.00 







616 ESTADl'STICA APLICADA a LOS NEGOCIOS Y LA ECONOMIA 



Tabla H Distribucion chi-cuadrado 


g . l . 

* 2 0.995 

v 2 

X 0.900 

* 2 0.S75 

* Z 0.950 

v 2 

X 0.900 

* 2 0.7QO 

* 2 0.5O0 

* 2 0.3G0 

* 2 0.200 

<V 2 o.idd 

* Z 0.O5O 

* 2 0.D25 

* 2 0.020 

/ V 2 0.010 

AfVoos 

1 

0.000 

0.000 

0.001 

0.004 

0.016 

0.148 

0.455 

1.074 

1.642 

2.706 

3.841 

5.024 

5.412 

6.635 

7.879 

2 

0.010 

0.020 

0.051 

0.103 

0.211 

0.713 

1.386 

2.408 

3.219 

4.605 

5.991 

7.378 

7.824 

9.210 

10.597 

3 

0.072 

0.115 

0.216 

0.352 

0.584 

1.424 

2.366 

3.665 

4.642 

6.251 

7.815 

9.348 

9.837 

11.345 

12.838 

4 

0.207 

0.297 

0.484 

0.711 

1.064 

2.195 

3.357 

4.878 

5.989 

7.779 

9.488 

11.143 

11.668 

13.277 

14.860 

5 

0.412 

0.554 

0.831 

1.145 

1.610 

3.000 

4.351 

6.064 

7.289 

9.236 

11.070 

12.833 

13.388 

15.086 

16.750 

6 

0.676 

0.872 

1.237 

1.635 

2.204 

3.828 

5.348 

7.231 

8.558 

10.645 

12.592 

14.449 

15.033 

16.812 

18.548 

7 

0.989 

1.239 

1.690 

2.167 

2.833 

4.671 

6.346 

8.383 

9.803 

12.017 

14.067 

16.013 

16.622 

18.475 

20.278 

8 

1.344 

1.646 

2.180 

2.733 

3.490 

5.527 

7.344 

9.524 

11.030 

13.362 

15.507 

17.535 

18.168 

20.090 

21.955 

9 

1.735 

2.088 

2.700 

3.325 

4.168 

6.393 

8.343 

10.656 

12.242 

14.684 

16.919 

19.023 

19.679 

21.666 

23.589 

10 

2.156 

2.558 

3.247 

3.940 

4.865 

7.267 

9.342 

11.781 

13.442 

15.987 

18.307 

20.483 

21.161 

23.209 

25.188 

11 

2.603 

3.053 

3.816 

4.575 

5.578 

8.148 

10.341 

12.899 

14.631 

17.275 

19.675 

21.920 

22.618 

24.725 

26.757 

12 

3.074 

3.571 

4.404 

5.226 

6.304 

9.034 

11.340 

14.011 

15.812 

18.549 

21.026 

23.337 

24.054 

26.217 

28.299 

13 

3.565 

4.107 

5.009 

5.892 

7.042 

9.926 

12.340 

15.119 

16.985 

19.812 

22.362 

24.736 

25.472 

27.688 

29.819 

14 

4.075 

4.660 

5.629 

6.571 

7.790 

10.821 

13.339 

16.222 

18.151 

21.064 

23.685 

26.119 

26.873 

29.141 

31.319 

15 

4.601 

5.229 

6.262 

7.261 

8.547 

11.721 

14.339 

17.322 

19.311 

22.307 

24.996 

27.488 

28.259 

30.578 

32.801 

16 

5.142 

5.812 

6.908 

7.962 

9.312 

12.624 

15.338 

18.418 

20.465 

23.542 

26.296 

28.845 

29.633 

32.000 

34.267 

17 

5.697 

6.408 

7.564 

8.672 

10.085 

13.531 

16.338 

19.511 

21.615 

24.769 

27.587 

30.191 

30.995 

33,409 

35.718 

18 

6.265 

7.015 

8.231 

9.390 

10.865 

14.440 

17.338 

20.601 

22.760 

25.989 

28.869 

31.526 

32.346 

34.805 

37.156 

19 

6.844 

7.633 

8.907 

10.117 

11.651 

15.352 

18.338 

21 .689 

23.900 

27.204 

30.144 

32.852 

33.687 

36.191 

38.582 

20 

7.434 

8.260 

9.591 

10.851 

12.443 

16.266 

19.337 

22.775 

25.038 

28.412 

31.410 

34.170 

35.020 

37.566 

39.997 

21 

8.034 

8.897 

10.283 

11.591 

13.240 

17.182 

20.337 

23.858 

26.171 

29.615 

32.671 

35.479 

36.343 

38.932 

41.401 

22 

8.643 

9.542 

10.982 

12.338 

14.041 

18.101 

21.337 

24.939 

27.301 

30.813 

33.924 

36.781 

37.659 

40.289 

42.796 

23 

9.260 

10.196 

11.689 

13.091 

14.848 

19.021 

22.337 

26.018 

28.429 

32.007 

35.172 

38.076 

38.968 

41.638 

44.181 

24 

9.886 

10.856 

12.401 

13.848 

15.659 

19.943 

23.337 

27.096 

29.553 

33.196 

36.415 

39.364 

40.270 

42.980 

45.559 

25 

10.520 

11.524 

13.120 

14.611 

16.473 

20.867 

24.337 

28.172 

30.675 

34.382 

37.652 

40.646 

41.566 

44.314 

46.928 

26 

11.160 

12.198 

13.844 

15.379 

17.292 

21.792 

25.336 

29.246 

31.795 

35.563 

38.885 

41.923 

42.856 

45.642 

48.290 

27 

11.808 

12.879 

14.573 

16.151 

18.114 

22.719 

26,336 

30.319 

32.912 

36.741 

40.113 

43.194 

44.140 

46.963 

49.645 

28 

12.461 

13.565 

15.308 

16.928 

18.939 

23.647 

27.336 

31.391 

34.027 

37.916 

41.337 

44.461 

45.419 

48.278 

50.993 

29 

t 13.121 

14.256 

16.047 

17.708 

19.768 

24.577 

28.336 

32.461 

35.139 

39.087 

42.557 

45.722 

46.693 

49.588 

52.336 

30 

13.787 

14.953 

16.791 

18.493 

20.599 

25.508 

29.336 

33.530 

36.250 

40.256 

43.773 

46.979 

47.962 

50.892 

53.672 

40 

20.707 

22.164 

24.433 

26.509 

29.051 

34.872 

39.335 

44.165 

47.269 

51.805 

55.758 

59.342 

60.436 

63.691 

66.766 

50 

27.991 

29.707 

32.357 

34.764 

37.689 

44.313 

49.335 

54.723 

58.164 

63.167 

67.505 

71.420 

72.613 

76.154 

79.490 

60 

35.534 

37.485 

40.482 

43.188 

46.459 

53.809 

59.335 

65.227 

68.972 

74.397 

79.082 

83.298 

84.580 

88.379 

91.952 

70 

43.275 

45.442 

48.758 

51.739 

55.329 

63.346 

69.334 

75.689 

79.715 

85.527 

90.531 

95.023 

96.388 

100.425 

104.215 

80 

51.172 

53.540 

57.153 

60.391 

64.278 

72.915 

79.334 

86.120 

90.405 

96.578 

101.879 

106.629 

108.069 

112.329 

116.321 

90 

59.196 

61.754 

65.647 

69.126 

73.291 

82.511 

89.334 

96.524 

101.054 

107.565 

113.145 

118.136 

119.648 

124.116 

128.299 

100 

67.328 

70.065 

74.222 

77.929 

82.358 

92.129 

99.334 

106.906 

111.667 

118.498 

124.342 

129.561 

131.142 

135.807 

140.169 
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Tabla I Logaritmos comunes 



0.0 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

1 

0.0000 

0.0414 

0.0792 

0.1139 

0.1461 

0.1761 

0.2041 

0.2304 

0.2553 

0.2788 

2 

0.3010 

0.3222 

0.3424 

0.3617 

0.3802 

0.3979 

0.4150 

0.4314 

0.4472 

0.4624 

3 

0.4771 

0.4914 

0.5051 

0.5185 

0.5315 

0.5441 

0.5563 

0.5682 

0.5798 

0.5911 

4 

0.6021 

0.6128 

0.6232 

0.6335 

0.6435 

0.6532 

0.6628 

0.6721 

0.6812 

0.6902 

5 

0.6990 

0.7076 

0.7160 

0.7243 

0.7324 

0.7404 

0.7482 

0.7559 

0.7634 

0.7709 

6 

0.7782 

0.7853 

0.7924 

0.7993 

0.8062 

0.8129 

0.8195 

0.8261 

0.8325 

0.8388 

7 

0.8451 

0.8513 

0.8573 

0.8633 

0.8692 

0.8751 

0.8808 

0.8865 

0.8921 

0.8976 

8 

0.9031 

0.9085 

0.9138 

0.9191 

0.9243 

0.9294 

0.9345 

0.9395 

0.9445 

0.9494 

9 

0.9542 

0.9590 

0.9638 

0.9685 

0.9731 

0.9777 

0.9823 

0.9868 

0.9912 

0.9956 

10 

1.0000 

1.0043 

1.0086 

1.0128 

1.0170 

1.0212 

1.0253 

1.0294 

1.0334 

1.0374 

11 

1.0414 

1.0453 

1.0492 

1.0531 

1.0569 

1.0607 

1.0645 

1.0682 

1.0719 

1.0755 

12 

1.0792 

1.0828 

1.0864 

1.0899 

1.0934 

1.0969 

1.1004 

1.1038 

1.1072 

1.1106 

13 

1.1139 

1.1173 

1.1206 

1.1239 

1.1271 

1.1303 

1.1335 

1.1367 

1.1399 

1.1430 

14 

1.1461 

1.1492 

1.1523 

1.1553 

1.1584 

1.1614 

1.1644 

1.1673 

1.1703 

1.1732 

15 

1.1761 

1.1790 

1.1818 

1.1847 

1.1875 

1.1903 

1.1931 

1.1959 

1.1987 

1.2014 

16 

1.2041 

1.2068 

1.2095 

1.2122 

1.2148 

1.2175 

1.2201 

1.2227 

1.2253 

1.2279 

17 

1.2304 

1.2330 

1.2355 

1.2380 

1.2405 

1.2430 

1.2455 

1.2480 

1.2504 

1.2529 

18 

1.2553 

1.2577 

1.2601 

1.2625 

1.2648 

1.2672 

1.2695 

1.2718 

1.2742 

1.2765 

19 

1.2788 

1.2810 

1.2833 

1.2856 

1.2878 

1.2900 

1.2923 

1.2945 

1.2967 

1.2989 

20 

1.3010 

1.3032 

1.3054 

1.3075 

1.3096 

1.3118 

1.3139 

1.3160 

1.3181 

1.3201 

21 

1.3222 

1.3243 

1.3263 

1.3284 

1.3304 

1.3324 

1.3345 

1.3365 

1.3385 

1.3404 

22 

1.3424 

1.3444 

1.3464 

1.3483 

1.3502 

1.3522 

1.3541 

1.3560 

1.3579 

1.3598 

23 

1.3617 

1.3636 

1.3655 

1.3674 

1.3692 

1.3711 

1.3729 

1.3747 

1.3766 

1.3784 

24 

1.3802 

1.3820 

1.3838 

1.3856 

1.3874 

1.3892 

1.3909 

1.3927 

1.3945 

1.3962 

25 

1.3979 

1.3997 

1.4014 

1.4031 

1.4048 

1.4065 

1.4082 

1.4099 

1.4116 

1.4133 

26 

1.4150 

1.4166 

1.4183 

1.4200 

1.4216 

1.4232 

1.4249 

1.4265 

1.4281 

1.4298 

27 

1.4314 

1.4330 

1.4346 

1.4362 

1.4378 

1.4393 

1.4409 

1.4425 

1.4440 

1.4456 

28 

1.4472 

1.4487 

1.4502 

1.4518 

1.4533 

1.4548 

1.4564 

1.4579 

1.4594 

1.4609 

29 

1.4624 

1.4639 

1.4654 

1.4669 

1.4683 

1.4698 

1.4713 

1.4728 

1.4742 

1.4757 

30 

1.4771 

1.4786 

1.4800 

1.4814 

1.4829 

1.4843 

1.4857 

1.4871 

1.4886 

1.4900 

31 

1.4914 

1.4928 

1.4942 

1.4955 

1.4969 

1.4983 

1.4997 

1.5011 

1.5024 

1.5038 

32 

1.5051 

1.5065 

1.5079 

1.5092 

1.5105 

1.5119 

1.5132 

1.5145 

1.5159 

1.5172 

33 

1.5185 

1.5198 

1.5211 

1.5224 

1.5237 

1.5250 

1.5263 

1.5276 

1.5289 

1.5302 

34 

1.5315 

1.5328 

1.5340 

1.5353 

1.5366 

1.5378 

1.5391 

1.5403 

1.5416 

1.5428 

35 

1.5441 

1.5453 

1.5465 

1.5478 

1.5490 

1.5502 

1.5514 

1.5527 

1.5539 

1.5551 

36 

1.5563 

1.5575 

1.5587 

1.5599 

1.5611 

1.5623 

1.5635 

1.5647 

1.5658 

1.5670 

37 

1.5682 

1.5694 

1.5705 

1.5717 

1.5729 

1.5740 

1.5752 

1.5763 

1.5775 

1.5786 

38 

1.5798 

1.5809 

1.5821 

1.5832 

1.5843 

1.5855 

1.5866 

1.5877 

1.5888 

1.5899 

39 

1.5911 

1.5922 

1.5933 

1.5944 

1.5955 

1.5966 

1.5977 

1.5988 

1.5999 

1.6010 

40 

1.6021 

1.6031 

1.6042 

1.6053 

1.6064 

1.6075 

1.6085 

1.6096 

1.6107 

1.6117 

41 

1.6128 

1.6138 

1.6149 

1.6160 

1.6170 

1.6180 

1.6191 

1.6201 

1.6212 

1.6222 

42 

1.6232 

1.6243 

1.6253 

1.6263 

1.6274 

1.6284 

1.6294 

1.6304 

1.6314 

1.6325 

43 

1.6335 

1.6345 

1.6355 

1.6365 

1.6375 

1.6385 

1.6395 

1.6405 

1.6415 

1.6425 

44 

1.6435 

1.6444 

1.6454 

1.6464 

1.6474 

1.6484 

1.6493 

1.6503 

1.6513 

1.6522 

45 

1.6532 

1.6542 

1.6551 

1.6561 

1.6571 

1.6580 

1.6590 

1.6599 

1.6609 

1.6618 
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Tabla I Logaritmos comunes (continuacion) 



0.0 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

46 

1.6628 

1.6637 

1.6646 

1.6656 

1,6665 

1.6675 

1.6684 

1.6693 

1.6702 

1.6712 

47 

1.6721 

1.6730 

1.6739 

1.6749 

1.6758 

1.6767 

1.6776 

1.6785 

1.6794 

1.6803 

48 

1.6812 

1.6821 

1.6830 

1.6839 

1.6848 

1.6857 

1 .6866 

1.6875 

1.6884 

1.6893 

49 

1.6902 

1.6911 

1.6920 

1.6928 

1.6937 

1.6946 

1.6955 

1.6964 

1.6972 

1.6981 

50 

1.6990 

1.6998 

1.7007 

1.7016 

1.7024 

1.7033 

1 .7042 

1.7050 

1.7059 

1.7067 

51 

1.7076 

1.7084 

1.7093 

1.7101 

1.7110 

1.7118 

1.7126 

1.7135 

1.7143 

1.7152 

52 

1.7160 

1.7168 

1.7177 

1.7185 

1.7193 

1.7202 

1.7210 

1.7218 

1.7226 

1.7235 

53 

1.7243 

1.7251 

1.7259 

1.7267 

1.7275 

1.7284 

1.7292 

1.7300 

1.7308 

1.7316 

54 

1.7324 

1.7332 

1.7340 

1.7348 

1.7356 

1.7364 

1.7372 

1.7380 

1.7388 

1.7396 

55 

1.7404 

1.7412 

1.7419 

1.7427 

1.7435 

1.7443 

1.7451 

1.7459 

1.7466 

1.7474 

56 

1.7482 

1.7490 

1.7497 

1.7505 

1.7513 

1.7520 

1.7528 

1.7536 

1.7543 

1.7551 

57 

1.7559 

1 .7566 

1.7574 

1.7582 

1.7589 

1.7597 

1.7604 

1.7612 

1.7619 

1.7627 

58 

1.7634 

1.7642 

1.7649 

1.7657 

1.7664 

1.7672 

1.7679 

1.7686 

1.7694 

1.7701 

59 

1.7709 

1.7716 

1.7723 

1.7731 

1.7738 

1.7745 

1.7752 

1.7760 

1.7767 

1.7774 

60 

1.7782 

1.7789 

1.7796 

1.7803 

1.7810 

1.7818 

1.7825 

1.7832 

1.7839 

1.7846 

61 

1.7853 

1.7860 

1.7868 

1.7875 

1.7882 

1.7889 

1.7896 

1.7903 

1.7910 

1.7917 

62 

1.7924 

1.7931 

1.7938 

1.7945 

1.7952 

1.7959 

1.7966 

1.7973 

1.7980 

1.7987 

63 

1.7993 

1.8000 

1.8007 

1.8014 

1.8021 

1.8028 

1.8035 

1.8041 

1.8048 

1.8055 

64 

1.8062 

1.8069 

1.8075 

1.8082 

1.8089 

1.8096 

1.8102 

1.8109 

1.8116 

1.8122 

65 

1.8129 

1.8136 

1.8142 

1.8149 

1.8156 

1.8162 

1.8169 

1.8176 

1.8182 

1.8189 

66 

1.8195 

1.8202 

1.8209 

1.8215 

1.8222 

1.8228 

1.8235 

1.8241 

1.8248 

1.8254 

67 

1.8261 

1.8267 

1.8274 

1.8280 

1.8287 

1.8293 

1.8299 

1.8306 

1.8312 

1.8319 

68 

1.8325 

1.8331 

1.8338 

1.8344 

1.8351 

1.8357 

1.8363 

1.8370 

1.8376 

1.8382 

69 

1.8388 

1.8395 

1.8401 

1.8407 

1.8414 

1.8420 

1.8426 

1.8432 

1.8439 

1.8445 

70 

1.8451 

1.8457 

1.8463 

1.8470 

1.8476 

1.8482 

1.8488 

1.8494 

1.8500 

1.8506 

71 

1.8513 

1.8519 

1.8525 

1.8531 

1.8537 

1.8543 

1.8549 

1.8555 

1.8561 

1.8567 

72 

1.8573 

1.8579 

1.8585 

1.8591 

1.8597 

1.8603 

1.8609 

1.8615 

1.8621 

1.8627 

73 

1.8633 

1.8639 

1.8645 

1.8651 

1.8657 

1.8663 

1.8669 

1.8675 

1.8681 

1.8686 

74 

1.8692 

1.8698 

1.8704 

1.8710 

1.8716 

1.8722 

1.8727 

1.8733 

1.8739 

1.8745 

75 

1.8751 

1.8756 

1.8762 

1.8768 

1.8774 

1.8779 

1.8785 

1.8791 

1.8797 

1.8802 

76 

1.8808 

1.8814 

1.8820 

1.8825 

1.8831 

1.8837 

1.8842 

1.8848 

1.8854 

1.8859 

77 

1.8865 

1.8871 

1.8876 

1.8882 

1.8887 

1.8893 

1.8899 

1.8904 

1.8910 

1.8915 

78 

1.8921 

1.8927 

1.8932 

1.8938 

1.8943 

1.8949 

1.8954 

1.8960 

1.8965 

1.8971 

79 

1.8976 

1.8982 

1.8987 

1.8993 

1.8998 

1.9004 

1.9009 

1.9015 

1.9020 

1.9025 

80 

1.9031 

1,9036 

1.9042 

1.9047 

1.9053 

1.9058 

1.9063 

1.9069 

1.9074 

1.9079 

81 

1.9085 

1.9090 

1.9096 

1.9101 

1.9106 

1.9112 

1.9117 

1.9122 

1.9128 

1.9133 

82 

1.9138 

1.9143 

1.9149 

1.9154 

1.9159 

1.9165 

1.9170 

1.9175 

1.9180 

1.9186 

83 

1.9191 

1.9196 

1.9201 

1.9206 

1.9212 

1.9217 

1.9222 

1.9227 

1.9232 

1.9238 

84 

1.9243 

1.9248 

1.9253 

1.9258 

1.9263 

1.9269 

1.9274 

1.9279 

1.9284 

1.9289 

85 

1.9294 

1.9299 

1.9304 

1.9309 

1.9315 

1.9320 

1.9325 

1.9330 

1.9335 

1.9340 

86 

1.9345 

1.9350 

1.9355 

1.9360 

1.9365 

1.9370 

1.9375 

1.9380 

1.9385 

1.9390 

87 

1.9395 

1.9400 

1.9405 

1.9410 

1.9415 

1.9420 

1.9425 

1.9430 

1.9435 

1.9440 

88 

1.9445 

1.9450 

1.9455 

1.9460 

1.9465 

1.9469 

1.9474 

1.9479 

1.9484 

1.9489 

89 

1.9494 

1.9499 

1.9504 

1.9509 

1.9513 

1.9518 

1.9523 

1.9528 

1.9533 

1.9538 

90 

1.9542 

1.9547 

1.9552 

1.9557 

1.9562 

1.9566 

1.9571 

1.9576 

1.9581 

1.9586 
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Tabla I Logaritmos comunes (fin) 



0.0 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

91 

1.9590 

1.9595 

1.9600 

1.9605 

1.9609 

1.9614 

1.9619 

1.9624 

1.9628 

1.9633 

92 

1.9638 

1.9643 

1.9647 

1.9652 

1.9657 

1.9661 

1.9666 

1.9671 

1.9675 

1.9680 

93 

1.9685 

1.9689 

1.9694 

1.9699 

1.9703 

1.9708 

1.9713 

1.9717 

1.9722 

1.9727 

94 

1.9731 

1.9736 

1.9741 

1.9745 

1.9750 

1.9754 

1.9759 

1.9763 

1.9768 

1.9773 

95 

1.9777 

1.9782 

1.9786 

1.9791 

1.9795 

1.9800 

1.9805 

1.9809 

1.9814 

1.9818 

96 

1.9823 

1.9827 

1.9832 

1.9836 

1.9841 

1.9845 

1.9850 

1.9854 

1.9859 

1.9863 

97 

1.9868 

1.9872 

1.9877 

1.9881 

1.9886 

1.9890 

1.9894 

1.9899 

1.9903 

1.9908 

98 

1.9912 

1.9917 

1.9921 

1.9926 

1.9930 

1.9934 

1.9939 

1.9943 

1.9948 

1.9952 

99 

1.9956 

1.9961 

1.9965 

1.9969 

1.9974 

1.9978 

1.9983 

1.9987 

1.9991 

1.9996 


Tabla J Alfabeto griego 


A 

a 

alpha 

N 

V 

nu 

B 

n 

beta 

E 

t 

xi 

r 

y 

gamma 

0 

o 

omicron 

A 

8 

delta 

n 

7 r 

Pi 

E 

€ 

epsilon 

p 

P 

rho 

Z 

( 

zeta 

X 

<j 

sigma 

H 

V 

eta 

T 

T 

tau 

e 

6 

theta 

Y 

V 

upsilon 

I 

t 

iota 

<t> 


phi 

K 

K 

kappa 

X 

X 

chi 

A 

A 

lambda 

* 

4> 

psi 

M 

M 

mu 

a 

CO 

omega 
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Tabla K Estadistico de Durbin-Watson (o(). Puntos de significancia de d L y d u (1%) 



*= 1 



* 2 

k = 

= 3 

k 

= 4 

k 

= 5 

n 


d u 

d L 

du 

d L 

d u 

d L 

du 

d L 

du 

15 

0.81 

1.07 

0.70 

1.25 

0.59 

1.46 

0.49 

1.70 

0.39 

1.96 

16 

0.84 

1.09 

0.74 

1.25 

0.63 

1.44 

0.53 

1.66 

0.44 

1.90 

17 

0.87 

1.10 

0.77 

1.25 

0.67 

1.43 

0.57 

1.63 

0.48 

1.85 

18 

0.90 

1.12 

0.80 

1.26 

0.71 

1.42 

0.61 

1.60 

0.52 

1.80 

19 

0.93 

1.13 

0.83 

1.26 

0.74 

1.41 

0.65 

1.58 

0.56 

1.77 

20 

0.95 

1.15 

0.86 

1.27 

0.77 

1.41 

0.68 

1.57 

0.60 

1.74 

21 

0.97 

1.16 

0.89 

1.27 

0.80 

1.41 

0.72 

1.55 

0.63 

1.71 

22 

1.00 

1.17 

0.91 

1.28 

0.83 

1.40 

0.75 

1.54 

0.66 

1.69 

23 

1.02 

1.19 

0.94 

1.29 

0.86 

1.40 

0.77 

1.53 

0.70 

1.67 

24 

1.04 

1.20 

0.96 

1.30 

0.88 

1.41 

0.80 

1.53 

0.72 

1.66 

25 

1.05 

1.21 

0.98 

1.30 

0.90 

1.41 

0.83 

1.52 

0.75 

1.65 

26 

1.07 

1.22 

1.00 

1.31 

0.93 

1.41 

0.85 

1.52 

0.78 

1.64 

27 

1.09 

1.23 

1.02 

1.32 

0.95 

1.41 

0.88 

1.51 

0.81 

1.63 

28 

1.10 

1.24 

1.04 

1.32 

0.97 

1.41 

0.90 

1.51 

0.83 

1.62 

29 

1.12 

1.25 

1.05 

1.33 

0.99 

1.42 

0.92 

1.51 

0.85 

1.61 

30 

1.13 

1.26 

1.07 

1.34 

1.01 

1.42 

0.94 

1.51 

0.88 

1.61 

31 

1.15 

1.27 

1.08 

1.34 

1.02 

1.42 

0.96 

1.51 

0.90 

1.60 

32 

1.16 

1.28 

1.10 

1.35 

1.04 

1.43 

0.98 

1.51 

0.92 

1.60 

33 

1.17 

1.29 

1.11 

1.36 

1.05 

1.43 

1.00 

1.51 

0.94 

1.59 

34 

1.18 

1.30 

1.13 

1.36 

1.07 

1.43 

1.01 

1.51 

0.95 

1.59 

35 

1.19 

1.31 

1.14 

1.37 

1.08 

1.44 

1.03 

1.51 

0.97 

1.59 

36 

1.21 

1.32 

1.15 

1.38 

1.10 

1.44 

1.04 

1.51 

0.99 

1.59 

37 

1.22 

1.32 

1.16 

1.38 

1.11 

1.45 

1.06 

1.51 

1.00 

1.59 

38 

1.23 

1.33 

1.18 

1.39 

1.12 

1.45 

1.07 

1.52 

1.02 

1.58 

39 

1.24 

1.34 

1.19 

1.39 

1.14 

1.45 

1.09 

1.52 

1.03 

1.58 

40 

1.25 

1.34 

1.20 

1.40 

1.15 

1.46 

1.10 

1.52 

1.05 

1.58 

45 

1.29 

1.38 

1.24 

1.42 

1.20 

1.48 

1.16 

1.53 

1.11 

1.58 

50 

1.32 

1.40 

1.28 

1.45 

1.24 

1.49 

1.20 

1.54 

1.16 

1.59 

55 

1.36 

1.43 

1.32 

1.47 

1.28 

1.51 

1.25 

1.55 

1.21 

1.59 

60 

1.38 

1.45 

1.35 

1.48 

1.32 

1.52 

1.28 

1.56 

1.25 

1.60 

65 

1.41 

1.47 

1.38 

1.50 

1.35 

1.53 

1.31 

1.57 

1.28 

1.61 

70 

1.43 

1.49 

1.40 

1.52 

1.37 

1.55 

1.34 

1.58 

1.31 

1.61 

75 

1.45 

1.50 

1.42 

1.53 

1.39 

1.56 

1.37 

1.59 

1.34 

1.62 

80 

1.47 

1.52 

1.44 

1.54 

1.42 

1.57 

1.39 

1.60 

1.36 

1.62 

85 

1.48 

1.53 

1.46 

1.55 

1.43 

1.58 

1.41 

1.60 

1.39 

1.63 

90 

1.50 

1.54 

1.47 

1.56 

1.45 

1.59 

1.43 

1.61 

1.41 

1.64 

95 

1.51 

1.55 

1.49 

1.57 

1.47 

1.60 

1.45 

1.62 

1.42 

1.64 

100 

1.52 

1.56 

1.50 

1.58 

1.48 

1.60 

1.46 

1.63 

1.44 

1.65 


n = numero de observaciones. 
k= numero de variables explicativas. 

Esta tabla se tomo de Biomctriko , vol. 41, 1951, p. 175, con permiso de los fideicomisarios. 
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Tabla K Estadistico de Durbin-Watson (oO ( continuation ). Puntos de significancia d L y d u ( 5 %) 


*= 1 k - 2 * = 3 *= 4 *=5 


n 

d L 

d u 

d L 

d u 

d L 

d u 

d L 

du 

d L 

du 

15 

1.08 

1.36 

0.95 

1.54 

0.82 

1.75 

0.69 

1.97 

0.56 

2.21 

16 

1.10 

1.37 

0.98 

1.54 

0.86 

1.73 

0.74 

1.93 

0.62 

2.15 

17 

1.13 

1.38 

1.02 

1.54 

0.90 

1.71 

0.78 

1.90 

0.67 

2.10 

18 

1.16 

1.39 

1.05 

1.53 

0.93 

1.69 

0.82 

1.87 

0.71 

2.06 

19 

1.18 

1.40 

1.08 

1.53 

0.97 

1.68 

0.86 

1.85 

0.75 

2.02 

20 

1.20 

1.41 

1.10 

1.54 

1.00 

1.68 

0.90 

1.83 

0.79 

1.99 

21 

1.22 

1.42 

1.13 

1.54 

1.03 

1.67 

0.93 

1.81 

0.83 

1.96 

22 

1.24 

1.43 

1.15 

1.54 

1.05 

1.66 

0.96 

1.80 

0.86 

1.94 

23 

1.26 

1.44 

1.17 

1.54 

1.08 

1.66 

0.99 

1.79 

0.90 

1.92 

24 

1.27 

1.45 

1.19 

1.55 

1.10 

1.66 

1.01 

1.78 

0.93 

1.90 

25 

1.29 

1.45 

1.21 

1.55 

1.12 

1.66 

1.04 

1.77 

0.95 

1.89 

26 

1.30 

1.46 

1.22 

1.55 

1.14 

1.65 

1.06 

1.76 

0.98 

1.88 

27 

1.32 

1.47 

1.24 

1.56 

1.16 

1.65 

1.08 

1.76 

1.01 

1.86 

28 

1.33 

1.48 

1.26 

1.56 

1.18 

1.65 

1.10 

1.75 

1.03 

1.85 

29 

1.34 

1.48 

1.27 

1.56 

1.20 

1.65 

1.12 

1.74 

1.05 

1.84 

30 

1.35 

1.49 

1.28 

1.57 

1.21 

1.65 

1.14 

1.74 

1.07 

1.83 

31 

1.36 

1.50 

1.30 

1.57 

1.23 

1.65 

1.16 

1.74 

1.09 

1.83 

32 

1.37 

1.50 

1.31 

1.57 

1.24 

1.65 

1.18 

1.73 

1.11 

1.82 

33 

1.38 

1.51 

1.32 

1.58 

1.26 

1.65 

1.19 

1.73 

1.13 

1.81 

34 

1.39 

1.51 

1.33 

1.58 

1.27 

1.65 

1.21 

1.73 

1.15 

1.81 

35 

1.40 

1.52 

1.34 

1.58 

1.28 

1.65 

1.22 

1.73 

1.16 

1.80 

36 

1.41 

1.52 

1.35 

1.59 

1.29 

1.65 

1.24 

1.73 

1.18 

1.80 

37 

1.42 

1.53 

1.36 

1.59 

1.31 

1.66 

1.25 

1.72 

1.19 

1.80 

38 

1.43 

1.54 

1.37 

1.59 

1.32 

1.66 

1.26 

1.72 

1.21 

1.79 

39 

1.43 

1.54 

1.38 

1.60 

1.33 

1.66 

1.27 

1.72 

1.22 

1.79 

40 

1.44 

1.54 

1.39 

1.60 

1.34 

1.66 

1.29 

1.72 

1.23 

1.79 

45 

1.48 

1.57 

1.43 

1.62 

1.38 

1.67 

1.34 

1.72 

1.29 

1.78 

50 

1.50 

1.59 

1.46 

1.63 

1.42 

1.67 

1.38 

1.72 

1.34 

1.77 

55 

1.53 

1.60 

1.49 

1.64 

1.45 

1.68 

1.41 

1.72 

1.38 

1.77 

60 

1.55 

1.62 

1.51 

1.65 

1.48 

1.69 

1.44 

1.73 

1.41 

1.77 

65 

1.57 

1.63 

1.54 

1.66 

1.50 

1.70 

1.47 

1.73 

1.44 

1.77 

70 

1.58 

1.64 

1.55 

1.67 

1.52 

1.70 

1.49 

1.74 

1.46 

1.77 

75 

1.60 

1.65 

1.57 

1.68 

1.54 

1.71 

1.51 

1.74 

1.49 

1.77 

80 

1.61 

1.66 

1.59 

1.69 

1.56 

1.72 

1.53 

1.74 

1.51 

1.77 

85 

1.62 

1.67 

1.60 

1.70 

1.57 

1.72 

1.55 

1.75 

1.52 

1.77 

90 

1.63 

1.68 

1.61 

1.70 

1.59 

1.73 

1.57 

1.75 

1.54 

1.78 

95 

1.64 

1.69 

1.62 

1.71 

1.60 

1.73 

1.58 

1.75 

1.56 

1.78 

100 

1.65 

1.69 

1.63 

1.72 

1.61 

1.74 

1.59 

1.76 

1.57 

1.78 


n = numero de observaciones. 

/c= numero de variables expiicativas. 

Esta tabla se tomo de Biometrika , vol. 41, 1951, p. 173, con permiso de los fideicomisarios. 
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Fuente: Reimpreso eon permiso de los fideicomisarios de Biometrika de E.S. Pearson y H.O. Hartley, eds., Biometrika Tables for Statisticians, vol. 1, 3 rd ed. 
(Cambridge University Press, 1966). 
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c uente: Reimpreso con permiso de los fideicomisarios de Biometrika de E.S. Pearson y H.O. Hartley, eds., Biometrika Tables for Statisticians, vol. 
Cambridge University Press, 1966). 
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Tabla M Valores criticos de r en la prueba de rachas 

La tabla Ml y M2 contienen varios va lores criticos de r para varios valores de ^ y n r Para Sa prueba de 
rachas de una sola muestra, todo valor de rque sea igual o menor que el mostrado en la tabla Ml o igual 
o mayor que el mostrado en la tabla M2 es significante al nivel del 0.05. 


Tabla Ml 



Tabla M2 



Sequence of alternatives", Annals of Mathematical Statistics 14, 1943, pp.66-87. Utilizado con autorizacion. 
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Tabla N Correlacion de rangos de Spearman, areas eombinadas en ambas colas 



Ejemplo : Para una prueba de dos colas de nivel de significancia de 0.20, con n = 10, el valor 
apropiado de r puede hallarse observando bajo la columna 0.20 y bajando hasta 10; alii se 
encontrara el valor apropiado de r que es 0.4424. 


n 

0.20 

0.10 

0.05 

0.02 

0.01 

0.002 

4 

0.8000 

0.8000 





5 

0.7000 

0.8000 

0.9000 

0.9000 



6 

0.6000 

0.7714 

0.8286 

0.8857 

0.9429 


7 

0.5357 

0.6786 

0.7450 

0.8571 

0.8929 

0.9643 

8 

0.5000 

0.6190 

0.7143 

0.8095 

0.8571 

0.9286 

9 

0.4667 

0.5833 

0.6833 

0.7667 

0.8167 

0.9000 

10 

0.4424 

0.5515 

0.6364 

0.7333 

0.7818 

0.8667 

11 

0.4182 

0.5273 

0.6091 

0.7000 

0.7455 

0.8364 

12 

0.3986 

0.4965 

0.5804 

0.6713 

0.7273 

0.8182 

13 

0.3791 

0.4780 

0.5549 

0.6429 

0.6978 

0.7912 

14 

0.3626 

0.4593 

0.5341 

0.6220 

0.6747 

0.7670 

15 

0.3500 

0.4429 

0.5179 

0.6000 

0.6536 

0.7464 

16 

0.3382 

0.4265 

0.5000 

0.5824 

0.6324 

0.7265 

17 

0.3260 

0.4118 

0.4853 

0.5637 

0.6152 

0.7083 

18 

0.3148 

0.3994 

0.4716 

0.5480 

0.5975 

0.6904 

19 

0.3070 

0.3895 

0.4579 

0.5333 

0.5825 

0.6737 

20 

0.2977 

0.3789 

0.4451 

0.5203 

0.5684 

0.6586 

21 

0.2909 

0.3688 

0.4351 

0.5078 

0.5545 

0.6455 

22 

0.2829 

0.3597 

0.4241 

0.4963 

0.5426 

0.6318 

23 

0.2767 

0.3518 

0.4150 

0.4852 

0.5306 

0.6186 

24 

0.2704 

0.3435 

0.4061 

0.4748 

0.5200 

0.6070 

25 

0.2646 

0.3362 

0.3977 

0.4654 

0.5100 

0.5962 

26 

0.2588 

0.3299 

0.3894 

0.4564 

0.5002 

0.5856 

27 

0.2540 

0.3236 

0.3822 

0.4481 

0.4915 

0.5757 

28 

0.2490 

0.3175 

0.3749 

0.4401 

0.4828 

0.5660 

29 

0.2443 

0.3113 

0.3685 

0.4320 

0.4744 

0.5567 

30 

0.2400 

0.3059 

0.3620 

0.4251 

0.4665 

0.5479 


Fuente: Adaptado de Glasser y Winter, Biometrika, 1961, con autorizacion de los fideicomisarios de 
Biometrika. 
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Tabla 0 Factores criticos de las cartas de control 



Carta para promedios 

Carta para rangos 

n 

Factor para el Ifmite 
de control 

^2 

Factor para la recta 
central 

4 

Factores de los limites 
de control 

D z D, 

dz 

2 

1.880 

1.128 

0 

3.267 

0.8525 

3 

1.023 

1.693 

0 

2.575 

0.8884 

4 

0.729 

2.059 

0 

2.282 

0.8798 

5 

0.577 

2.326 

0 

2.115 

0.8641 

6 

0.483 

2.534 

0 

2.004 

0.8480 

7 

0.419 

2.704 

0.076 

1.924 

0.833 

8 

0.373 

2.847 

0.136 

1.864 

0.820 

9 

0.337 

2.970 

0.184 

1.816 

0.808 

10 

0.308 

3.078 

0.223 

1.777 

0.797 

11 

0.285 

3.173 

0.256 

1.744 

0.787 

12 

0.266 

3.258 

0.284 

1.716 

0.778 

13 

0.249 

3.336 

0.308 

1.692 

0.770 

14 

0.235 

3.407 

0.329 

1.671 

0.762 

15 

0.223 

3.472 

0.348 

1.652 

0.755 

16 

0.212 

3.532 

0.364 

1.636 

0.749 

17 

0.203 

3.588 

0.379 

1.621 

0.743 

18 

0.194 

3.640 

0.392 

1.608 

0.738 

19 

0.187 

3.689 

0.404 

1.596 

0.733 

20 

0.180 

3.735 

0.414 

1.586 

0.729 

21 

0.173 

3.778 

0.425 

1.575 

0.724 

22 

0.167 

3.819 

0.434 

1.566 

0.720 

23 

0.162 

3.858 

0.443 

1.557 

0.716 

24 

0.157 

3.895 

0.452 

1.548 

0.712 

25 

0.153 

3.931 

0.459 

1.541 

0.709 


Fuente: Los valores de d 2 y d 3 provienen de E.S. Pearson, "The Percentage Limites for the Distribution of 
Range in Samples from a Normal Population", Biometrika 24, 1932, p. 416. Utilizado con autorizacion de 
los fideicomisarios de Biometrika. 

A, = 3/(d 2 Vn), D 3 = 1 - 3(4/4), = 1 + 3(4/4). 
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Tabla P Combinatorios 


n 

A 

A 

A 

A 3 

A 

A 

A 

A 

A 

A 

Ao 

0 

1 











1 

1 

1 










2 

1 

2 

1 









3 

1 

3 

3 

1 








4 

1 

4 

6 

4 

1 







5 

1 

5 

10 

10 

5 

i 






6 

1 

6 

15 

20 

15 

6 

1 





7 

1 

7 

21 

35 

35 

21 

7 

1 




8 

1 

8 

28 

56 

70 

56 

28 

8 

1 



9 

1 

9 

36 

84 

126 

126 

84 

36 

9 

i 


10 

1 

10 

45 

120 

210 

252 

210 

120 

45 

10 

i 

11 

1 

11 

55 

165 

330 

462 

462 

330 

165 

55 

ii 

12 

1 

12 

66 

220 

495 

792 

924 

792 

495 

220 

66 

13 

1 

13 

78 

286 

715 

1287 

1716 

1716 

1287 

715 

286 

14 

1 

14 

91 

364 

1001 

2002 

3003 

3432 

3003 

2002 

1001 

15 

1 

15 

105 

455 

1365 

3003 

5005 

6435 

6435 

5005 

3003 

16 

1 

16 

120 

560 

1820 

4368 

8008 

11440 

12870 

11440 

8008 

17 

1 

17 

136 

680 

2380 

6188 

12376 

19448 

24310 

24310 

19448 

18 

1 

18 

153 

816 

3060 

8568 

18564 

31824 

43758 

48620 

43758 

19 

1 

19 

171 

969 

3876 

11628 

27132 

50388 

75582 

92378 

92378 

20 

1 

20 

190 

1140 

4845 

15504 

38760 

77520 

125970 

167960 

184756 


P( 0< Z< 1.96) = 0.4750 



1.96 Z 


Tabla E Distribution normal 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.0000 

0.0040 

0.0080 

0.0120 

0.0160 

0.0199 

0.0239 

0.0279 

0.0319 

0.0359 

0.1 

0.0398 

0.0438 

0.0478 

0.0517 

0.0557 

0.0596 

0.0636 

0.0675 

0.0714 

0.0753 

0.2 

0.0793 

0.0832 

0.0871 

0.0910 

0.0948 

0.0987 

0.1026 

0.1064 

0.1103 

0.1141 

0.3 

0.1179 

0.1217 

0.1255 

0.1293 

0.1331 

0.1368 

0.1406 

0.1443 

0.1480 

0.1517 

0.4 

0.1554 

0.1591 

0.1628 

0.1664 

0.1700 

0.1736 

0.1772 

0.1808 

0.1844 

0.1879 

0.5 

0.1915 

0.1950 

0.1985 

0.2019 

0.2054 

0.2088 

0.2123 

0.2157 

0.2190 

0.2224 

0.6 

0.2257 

0.2291 

0.2324 

0.2357 

0.2389 

0.2422 

0.2454 

0.2486 

0.2517 

0.2549 

0.7 

0.2580 

0.2611 

0.2642 

0.2673 

0.2704 

0.2734 

0.2764 

0.2794 

0.2823 

0.2852 

0.8 

0.2881 

0.2910 

0.2939 

0.2967 

0.2995 

0.3023 

0.3051 

0.3078 

0.3106 

0.3133 

0.9 

0.3159 

0.3186 

0.3212 

0.3238 

0.3264 

0.3289 

0.3315 

0.3340 

0.3365 

0.3389 

1.0 

0.3413 

0.3438 

0.3461 

0.3485 

0.3508 

0.3531 

0.3554 

0.3577 

0.3599 

0.3621 

1.1 

0.3643 

0.3665 

0.3686 

0.3708 

0,3729 

0.3749 

0.3770 

0.3790 

0.3810 

0.3830 

1.2 

0.3849 

0.3869 

0.3888 

0.3907 

0.3925 

0.3944 

0.3962 

0.3980 

0.3997 

0.4015 

1.3 

0.4032 

0.4049 

0.4066 

0.4082 

0.4099 

0.4115 

0.4131 

0.4147 

0.4162 

0.4177 

1.4 

0.4192 

0.4207 

0.4222 

0.4236 

0.4251 

0.4265 

0.4279 

0.4292 

0.4306 

0.4319 

1.5 

0.4332 

0.4345 

0.4357 

0.4370 

0.4382 

0.4394 

0.4406 

0.4418 

0.4429 

0.4441 

1.6 

0.4452 

0.4463 

0.4474 

0.4484 

0.4495 

0.4505 

0.4515 

0.4525 

0.4535 

0.4545 

1.7 

0.4554 

0.4564 

0.4573 

0.4582 

0.4591 

0.4599 

0.4608 

0.4616 

0.4625 

0.4633 

1.8 

0.4641 

0.4649 

0.4656 

0.4664 

0.4671 

0.4678 

0.4686 

0.4693 

0.4699 

0.4706 

1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 

0.4750 

0.4756 

0.4761 

0.4767 

2.0 

0.4772 

0.4778 

0.4783 

0.4788 

0.4793 

0.4798 

0.4803 

0.4808 

0.4812 

0.4817 

2.1 

0.4821 

0.4826 

0.4830 

0.4834 

0.4838 

0.4842 

0.4846 

0.4850 

0.4854 

0.4857 

2.2 

0.4861 

0.4864 

0.4868 

0.4871 

0.4875 

0.4878 

0.4881 

0.4884 

0.4887 

0.4890 

2.3 

0.4893 

0.4896 

0.4898 

0.4901 

0.4904 

0.4906 

0.4909 

0.4911 

0.4913 

0.4916 

2.4 

0.4918 

0.4920 

0.4922 

0.4925 

0.4927 

0.4929 

0.4931 

0.4932 

0.4934 

0.4936 

2.5 

0.4938 

0.4940 

0.4941 

0.4943 

0.4945 

0.4946 

0.4948 

0.4949 

0.4951 

0.4952 

2.6 

0.4953 

0.4955 

0.4956 

0.4957 

0.4959 

0.4960 

0.4961 

0.4962 

0.4963 

0.4964 

2.7 

0.4965 

0.4966 

0.4967 

0.4968 

0.4969 

0.4970 

0.4971 

0.4972 

0.4973 

0.4974 

2.8 

0.4974 

0.4975 

0.4976 

0.4977 

0.4977 

0.4978 

0.4979 

0.4979 

0.4980 

0.4981 

2.9 

0.4981 

0.4982 

0.4982 

0.4983 

0.4984 

0.4984 

0.4985 

0.4985 

0.4986 

0.4986 

3.0 

0.4987 

0.4987 

0.4987 

0.4988 

0.4988 

0.4989 

0.4989 

0.4989 

0.4990 

0.4990 

3.1 

0.4990 

0.4991 

0.4991 

0.4991 

0.4992 

0.4992 

0.4992 

0.4992 

0.4993 

0.4993 

3.2 

0.4993 

0.4993 

0.4994 

0.4994 

0.4994 

0.4994 

0.4994 

0.4995 

0.4995 

0.4995 

3.3 

0.4995 

0.4995 

0.4995 

0.4996 

0.4996 

0.4996 

0.4996 

0.4996 

0.4996 

0.4997 

3.4 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4997 

0.4998 

3.5 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4998 

0.4498 

3.6 

0.4998 

0.4998 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.7 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.8 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

0.4999 

3.9 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 

0.5000 





Tabla F La distribution t 



0.900 

0.700 

0.500 

m 

0.200 




mm 

Valor a 

1 Prueba 


0.100 

0.300 

0.500 

Hi 

0.800 

0.900 



RSI 

1C 

J de dos colas 



0.350 





0.025 

0.010 

0.005 

Valor a 

1 Prueba 






■Hi 


0.975 

0.990 

0.995 

1C 

* de una cola 

g . i . 

Valores de t 



i 

0.158 

0.510 


1.963 

3.078 

6.314 

12.706 

31.821 

63.657 



2 

0.142 

0.445 

0.816 

1.386 

1.886 

2.920 

4.303 

6.965 

9.925 



3 

0.137 

0.424 

0.765 

1.250 

1.638 

2.353 

3.182 

4.541 

5.841 



4 

mm 

0.414 

0.741 

1.190 

1.533 

2.132 

2.776 

3.747 

4.604 



5 

BIM 


0.727 

1.156 

1.476 

2.015 

2.571 

3.365 

4.032 



6 



0.718 

1.134 

1.440 

1.943 

2.447 

3.143 

3.707 



7 



0.711 

1.119 

1.415 

1.895 

2.365 

2.998 

3.499 



8 


0.399 

mm 

1.108 

1.397 

1.860 

2.306 

2.896 

3.355 



9 


0.398 

mm 

1.100 

1.383 

1.833 

2.262 

2.821 

3.250 



10 


0.397 


1.093 

1.372 

1.812 

2.228 

2.764 

3.169 



11 


0.396 

0.697 

1.088 

1.363 

1.796 

2.201 

2.718 

3.106 



12 


0.395 

0.695 

1.083 

1.356 

1.782 

2.179 

2.681 

3.055 



13 


0.394 

0.694 

1.079 

1.350 

1.771 

2.160 

2.650 

3.012 



14 


0.393 

0.692 

1.076 

1.345 

1.761 

2.145 

2.624 

2.977 



15 


0.393 

0.691 

1.074 

1.341 

1.753 

2.131 

2.602 

2.947 



16 


0.392 


1.071 

1.337 

1.746 

2.120 

2.583 

2.921 



17 

0.128 

0.392 

0.689 

1.069 

1.333 

1.740 

2.110 

2.567 

2.898 



18 

mm 

0.392 

0.688 

1.067 

1.330 

1.734 

2.101 

2.552 

2.878 



19 

mm 

0.391 

0.688 

1.066 

1.328 

1.729 

2.093 

2.539 

2.861 



20 


0.391 

0.687 

1.064 

1.325 

1.725 

2.086 

2.528 

2.845 



21 


0.391 

0.686 

1.063 

1.323 

1.721 

2.080 

2.518 

2.831 



22 


0.390 

0.686 

1.061 

1.321 

1.717 

2.074 

2.508 

2.819 



23 



0.685 

1.060 

1.319 

1.714 

2.069 

2.500 

2.807 



24 



0.685 

1.059 

1.318 

1.711 

2.064 

2.492 

2.797 



25 



0.684 

1.058 

1.316 

1.708 

2.060 

2.485 

2.787 



26 



0.684 

1.058 

1.315 

1.706 

2.056 

2.479 

2.779 



27 


0.389 

0.684 

1.057 

1.314 

1.703 

2.052 

2.473 

2.771 



28 


0.389 

0.683 

1.056 

1.313 

1.701 

2.048 

2.467 

2.763 



29. 


0.389 

0.683 

1.055 

1.311 

1.699 

2.045 

2.462 

2.756 



" ^30 


0.389 

0.683 

1.055 

1.310 

1.697 

2.042 

2.457 

2.750 



40 

I 

0.388 

0.681 

1.050 

1.303 

1.684 

2.021 

2.423 

2.704 



60 

■Sgjfl 

0.387 

0.679 

1.045 

1.296 

1.671 

2.000 

2.390 

2.660 



120 


0.386 

0.677 

1.041 

1.289 

1.658 

1.980 

2.358 

2.617 



00 


0.385 

0.674 

1.036 

1.282 

1.645 

1.960 

2.326 

2.576 












f §j£ - ■ - 


l#ii 


:■: W.' .V '' 


INDICE 031 


A 

Aleatoriedad, 482-484 
Analisis de correlacion, 345-348 

Analisis de la varianza (ANOVA), 272-274; ANOVA 
a dos vias 

en el modelo de regresion, 358-359 
modelo de regresion multiple, 383-384 
prueba para disenos balanceados, 283-286 
prueba para el diseno no balanceado, 286-289 
razon-F, 276 
tabla, 280-283 

Analisis de regresion, 325-326; ver tambien 
regresion multiple 

error estandar de estimacion, 341-344 
estimacion de intervalo en, 353-357 
limitaciones de, 349 

rmnimos cuadrados ordinarios (MCO), 328- 
331 

modelo lineal simple, 326-328 
Analisis de tendencia, 424-427 
Analisis de varianza a dos vias (ANOVA), 

Diseno aleatorizado en bloques, 289-298 
Analisis de varianza a una via 
definicion, 274-275 
fundamentos, 275,276 
Analisis factorial, 298-302 
Analistas economicos, 6 
Analistas financieros, 6 

Aproximacion normal, a la distribution binomial, 
132-133, 137 

Autocorrelacion negativa, 339-340 
Autocorrelacion positiva, 339-340 
Autocorrelacion, 339-340 

B 

Bayes, Rev. Thomas, 90 
Bernoulli, Jacob, 108 
Bloqueo, 289-292 

Bondad de ajuste; ver error estandar de estimacion 


coeficiente de determinacion multiple, 381-382 
para chi cuadrado (x 2 ), 465-472 

C 

Carta X, 527-529 
Carta R, 529-532 
Cartas c, 537-541 
Cartas de control de atributos 
cartas c y 537-541 
cartas p, 533-537 
Cartas de control de variables 
carta F, 529-532 
carta X, 527-529 
Cartas de control, 521 

interpretation, 541-542 
para atributos 

cartas c, 537-541 
cartas p , 533-537 
para variables, 523-526 
carta R , 529-533 
carta X, 527-529 
Cartas P 9 533-537 
Causalidad, 349 
Celdas, 25 

Centro de Fondo Mutuo Tradeline, 73 
Centro del Fondo de Inversion Mutuo, 73 
Chebyshev, RL., 59 
Circulos de control de calidad, 7 
Clase(s), c, 21-24 

determinacion del numero de, 22 
intervalo, 23 
limites, 22 
punto medio, M, 23 
regia para determinar numero de, 22 
Coeficiente de confianza, 171-172 

Coeficiente de correlacion poblacional pruebas para, 
351-352 

Coeficiente de correlacion producto-momento de 
Pearson, 345 
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Coeficiente de correlacion, 345-347 
Coeficiente de determination corregido, 382 
Coeficiente de determination multiple, 381-382 
Coeficiente de determination, 348 
Coeficiente de regresion, 331 
comparacion, 394-395 
Coeficiente de sesgo de Pearson, 63 
Coeficiente de sesgo, 63 
Coeficiente de variation (CV), 63 

Coeficientes beta; ver coeficientes de regresion 
estandarizados 

Coeficientes de regresion estandar, 395 
Coeficientes de regresion partial, 377 
Coeficientes de regresion partial, 377 
pruebas individuales, 385-387 
Combinaciones, 93, 94 
Comparacion por pares 

criterio de Tukey, 283-284 

diferencia menos significativa (DMS), 283- 
286 

Computadores; ver Excel; Minitab 
Conjunto de datos bimodales, 42 
Conjunto, 80 

Control de calidad (CC), 7 
historia del, 521-523 
Control estadfstico de calidad, 7-8 
Correlacion de rangos de Spearman, 491-495, 499 
Correlacion espurea, 349 
Correlacion, causalidad y, 349 
Criterio de Tukey (T), 283-284 
Cuadrado medio de los tratamientos (CMTR), 279 
Cuadrado medio del error (CME), 279 
Cuadrado medio total (CMT), 279 
Cuartiles, 57-58 

Curva simetrica en forma de campana, 60 
Curvas caracterfsticas de operation (CO), 545-546 


D 

Datos agrupados 
media, 53-54 
mediana, 54 
moda, 55 

varianza y desviacion estandar para, 55-56 

Datos, mtiodo de agrupacion, 21; ver tambien 
datos agrupados 

Deciles, 57-59 

Deflactar, una serie de tiempo, 446 
Deming, W. Edward, 521-523 
Despliegue en funcion de la calidad, 7 
Desviacion estandar 

distribuciones de probabilidad, 107 
intervalos de confianza y, 174-175 
muestra s, 50-52 
poblacional, 48-50 
usos frecuentes de la, 59-64 

Desviacion estandar de la muestra, para datos 
agrupados, 55-56 

Desviacion explicada, 346 
Desviacion no explicada, 347 
Desviacion normal, 125-126, 183 

calculo de probabilidades con, 126-130 

la distribution de las proporciones muestrales, 
158 

Desviacion total, 346 
Desviacion, medidas de, 346-347 
Diagrama de arbol, 91 
Diagrama de Pareto, 7 
Diagrama de tallo y hoja, 29 
Diagrama de Venn, 80 
Diagramas circular, 28 
Diagramas de dispersion, 325-326 
Diferencia estadisticamente insignificante, 199-200 
Diferencia menos significativa (DMS) 
para disenos balanceados, 283-286 
para disenos no balanceados, 286-288 
Diseno aleatorizado en bloques, 289-298 
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Diseno completamente aleatorizado, 300; ver 
tambien ANOVA a una via 
Diseno de bloques, 300 
Diseno en cuadrado latino, 302-305 

Disenos balanceados, pruebas para; ver tambien 
disenos no balanceados 

criterio de Tukey, 284 

metodo de diferencia menos significativo, 
285-286 

Disenos no balanceados; ver tambien disenos 
balanceados, pruebas alternas para el metodo 
DMS, 286-289 

Dispersion, ver medidas de dispersion, 
Distribucion 

binomial, 108-113 
de Poisson, 115-118 
discreta, 106-108 
exponencial, 118-120 
hipergeometrica, 113-115 
normal, 123-133 
muestral, 145-150 
uniforme, 120-123 
Distribucion Z, 176 
Distribucion chi-cuadrado (% 2 ), 59 

pruebas de bondad de ajuste, 465-472 
pruebas de independencia, 472-477 

Distribucion de frecuencia acumulada “mas de”, 
23 

Distribucion de frecuencia acumulada “menor que”, 
23-24 

Distribucion de frecuencias, 21-24 
acumulada “mas que”, 23 
acumulada “menor que”, 23-24 
relativa, 24 

Distribucion de la frecuencia relativa, 24 
Distribucion de Poisson, 115-118; 135 
uso del computador para, 117-118 
Distribucion de probabilidad uniforme, 120-123 
uso del computador para, 122 
Distribucion de probabilidad, 105-106 
desviacion estandar de una, 107 


media de una, 106 
varianza de una, 106-107 
Distribucion exponencial, 118-119, 135 
usando el computador, 119-120 
Distribucion F, 253-255 
Distribucion hipergeometrica, 113-115 
Distribucion muestral, 152-153, 171 
definition, 145-146 
de las medias muestrales, 146-147 
aplicaciones, 152-157 
error estandar, 147-149 
media, 146-147 

teorema del limite central, 150-151 
varianza, 147-149 

de las proporciones muestrales, 157-159 
error estandar, 158 
valor esperado, 157-158 
Distribucion normal estandar, 125 
Distribucion normal, 60-62, 123-126, 135-136 
Distribucion t de Student, 176-178 

Distribucion - 1 , 234-238, 249-250; ver tambien 
distribucion t de Student 

Distribucion uniforme, 135 
Distribuciones binomiales acumuladas, 111-112 
Distribuciones binomiales, 134 
acumuladas, 111-112 
aproximacion normal a, 132-133, 137 
calculo, 109-110 
definidas, 108 
media, 110 
propiedades de, 108 
usando el computador para, 112-113 
varianza, 111 

Distribuciones discretas, 106-108 
Dos poblaciones, 230-231 

E 

Efecto de tratamiento, 276 

Elaboration de reportes de negocios, 561-567 
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Error 

nivel de signification y, 201 
tipo I, 201 
tipo II, 201 
tolerable, 183 
Error de muestreo, 145 
causas de, 10 
definicion, 11 
fuentes, 160 
Error estandar 

de la media condicionada, 353 
de las medias muestrales, 147-149 
del pronostico, 355 

impacto del tamano de la muestra en, 149 
para diferencia de dos proporciones, 243 

utilizando el factor de correccion para 
poblaciones flnitas (fpc), 149 

Error estandar de estimacion (Se), 341-344 
para regresion multiple, 379-380 
Error Tipo I, 201 

muestreo de aceptacion, 543 
Error Tipo II, 201 

muestreo de aceptacion, 544 
Error tolerable, 183 
Espacio muestral (EM), 77 
Estadistica 

aplicacion universal de la, 6 
definicion, 9 
descriptiva, 10 
funciones de la, 11-12 
oportunidades en la carrera de, 6-8 
importancia de la, 4-5 
inferencial, 10 
Estadistica descriptiva, 10 
Estadistica inferencial, 10, 144-145 
Estadfstico de prueba Z 

para muestras grandes, 246-247 
Estimacion mancomunada, 234 
Estimacion puntual, 170-171 


Estimacion, 170-171 

definicion, 186-187 
Estimador insesgado (Theta), 187 
Estimador consistente, 188 
Estimador eficiente, 188 
Estimador suficiente, 189 
Estimadores, 186-187 
definicion, 186-187 
propiedades de los buenos, 186-187 
Eventos colectivamente exhaustivos, 81 
Eventos complementarios, 82 
Eventos dependientes, probabilidad de, 86 
Eventos independientes, 81-82 

probabilidad conjunta de, 86-87 
Eventos mutuamente excluyentes, 81 
Eventos no disyuntos, 81 

determination de la probabilidad de, 86-88 
Eventos, 80-82 

Evidencia de caminata aleatoria, 413 

Exactitud, 10-11 

Excel 

para distribuciones binomiales, 112 
para distribuciones hipergeometricas, 113 
para la distribucion de Poisson, 117-118 
para la distribucion exponencial, 119 
Exito, probabilidad de ( 7 t), 109 
Experimento, definicion, 77 

F 

Factor de correccion de continuidad, 133 

Factor de correccion para poblaciones finitas (fpc), 
149 

Factor de inflacion de la varianza (FIV), 392 
Fisher, Sir Ronald A., 253 
FIV, ver factor de inflacion de la varianza (FIV) 
Fluctuaciones estacionales, 414 
Fluctuaciones, 414 

Formation estadistica, necesidad de, 8 
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Formula de conversion; ver formula Z 
Formula Z, 125-126, 152 
Fracaso, probabilidad de (1 - 7t), 109 
Frecuencia relativa, 77-78 
Frecuencias esperadas, 468-469 

G 

Galton, Sir Francis, 325 
Gerencia de calidad total (GCT), 7-8 
Gosset, William S., 176 
Grados de libertad, 5 1 

para varianzas poblacionales desiguales, 236- 
237 

Grafico de maximos-mmimos - cierre, 28, 29 
Graficos de minimos, maximos y cierre, 29 

H 

Heteroscedasticidad, 337 
Hiperplano, 378 
Hipotesis 

alternativa, 199 
nula, 199 

Hipotesis alternativa, 199; ver tambien hipotesis 
nula 

Hipotesis nula, 199 
Histograma, 27-28 
Homoscedasticidad, 337-338 

I 

I.C.; ver intervalo de confianza (I.C) 

Incremento puntual porcentual, 438 

Indice industrial Dow Jones, 445 

Indice agregativo de Standard & Poor, 445 

Indice de Laspeyres, 440-444 

Indice de Paasche, 441-444 

Indice de precios agregativos ponderados 


Laspeyres, 440-444 
Paasche, 441-444 
Indice de precios agregativos, 439 
Indice de precios al consumidor (IPC), 445-448 
Indice de precios simple, 436-439 
Indice de produccion industrial, 445 
Indice precios al productor, 445 
Informe de la industria educativa, 4 
Ingreso real, 447 
Interaccion, 300-301 
Internet, information de la carrera en, 17 
Intersection, 80 
Intervalo 

factores que influyen el ancho de un, 357 
en analisis de regresion, 353-358 
estimation por, 170-171 

intervalo de confianza para la diferencia entre 
dos proporciones, 243-244 

muestras independientes 
muestra grande, 231-234 
muestra pequena, 234-238 
muestras pareadas, 238-242 
Intervalo de confianza (I.C), 171-172 
control del ancho de, 182-183 

cuando la desviacion estandar de la poblacion 
es conocida, 174-175 

de la media condicionada, 353 
de la media poblacional 

muestras grandes, 172-176 
muestras pequenas, 176-180 
fundamentos del, 171-172 
interpretacion, 173-174 
para el intervalo de prediccion, 355 

para la diferencia entre dos proporciones, 243- 
244 

para proporciones poblacionales, 180-181 
Intervalo de prediccion, 353 

para un valor unico de Y , 355-357 
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J 

Juram, Joseph, 523 


L 

La gran media, 146-147, 275 
LIC; ver Limite inferior de confianza (LIC) 
Limite inferior de confianza (LIC), 171 
Limite superior de confianza (LSC), 171 
LSC; ver Limite superior de confianza (LSC) 


M 

Media aritmetica, 41 

Media condicionada, 353-355 

Media de la muestra ( X barra), 41 

Media de las sumas de cuadrados, 278-280 

Media geometrica, 44-46 

Media poblacional, 41 

Media ponderada, 43-44 

Media; ver tambien media poblacional; Media 
muestral 

comparada con la mediana y la moda, 46-47 
de distribucion de probabilidad, 106 
de las distribuciones binomiales, 110 
de las medias muestrales, 146-147 
geometrica, 44-46 

intervalo de confianza para la media 
poblacional, 172-176 

intervalos de muestras pequenas para la, 176- 
179 


para datos agrupados, 53-54 

ponderada, 43-44 

prueba de una cola para, 206-208 

pruebas con muestras pequenas para estimar 
la, 213-215 


pruebas de dos colas para la, 202-203 

selection del estadistico de prueba apropiado 
para estimar la, 179 

tamano de la muestra para estimar la, 183 


Mediana, 42 

comparada la media y la moda, 46-47 
para datos agrupados, 54 
Medicion, escalas de 
intervalo, 13 
nominal, 12-13 
ordinal, 13 
razon, 14 

Medidas de dispersion, 41, 47-48, 57-58 
definition, 46-47 
desviacion estandar, 48-50 
para datos agrupados, 55-57 
rango, 48 
relativas, 63 
varianza, 48-50 

Medidas de tendencia central, 40-41 
comparacion, 46-47 
media geometrica, 44-46 
media ponderada, 43 
media, 41 
mediana, 42 
moda, 42-43 

para datos agrupados, 53-55 
Medidas en escala de intervalo, 13-14 
Medidas en escala de razon, 14 
Medidas en escala nominal, 12-13 
Medidas en escala ordinal, 13 

Mejoramiento del producto; ver control de calidad 
(CC) 

Metodo de conteo de option multiple, 95 
Metodos de muestreo, 160-163 
aleatorio simple, 161 
estratificado, 161 
por conglomerados, 162 
sistematico, 161 

Minimos cuadrados ordinarios (MCO), 328-330 
aplicacion a la prueba de rachas, 484-486 
Minitab 

distribucion de Poisson, 117-118 
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intervalos de confianza, 174-175 
para distributions binomiales, 112 
prueba de dos colas para miu (|Li), 203 
distribution uniforme, 122-123 
valor p, 211 
Moda, 42-43 

comparada con la mediana y la media, 46-47 
para datos agrupados, 55 
Modelo clasico de probabilidad, 78 
Modelo de efectos aleatorios, 273 
Modelo de efectos fijos, 273 
Modelo subjetivo de la probabilidad, 78 

Modelos logarftmicos en la regresion curvilmea, 
403-404 

Modelos polinomiales de regresion curvilmea, 401- 
402 

Muestra aleatoria simple, 161 
Muestra, 10, 144 
definition, 9 

desviacion estandar, 50-51 
varianza, 50-52 
Muestras independientes 

estimation con muestras grandes, 231-234 
estimation con muestras pequenas, 234-238 

Muestras independientes, para pruebas con dos 
poblaciones, 231 

Muestras pareadas, 238-242 

para pruebas con dos poblaciones, 231 
pruebas de hipotesis con, 250-251 
Muestreo 

aleatorio simple, 161 
con reemplazo, 149 
estratificado, 161 
por conglomerados, 162 
sistematico, 161 

Muestreo de aceptacidn, 8, 543-546 
Muestreo estratificado, 161 
Muestreo por conglomerados, 162 
Muestreo sistematico, 161 
Multicolinealidad, 377, 390-394 


N 

Nivel de calidad aceptable (NCA), 8, 543 
Nivel de significancia, 200-201 
probabilidad de error y, 201 
Norma estadistica, en variation cfclica, 434-435 
Numero de aceptacion, 544 
Numero fndice 

de precios agregativos, 439 
de precios agregativos ponderados 
Laspeyres, 440-444 
Paasche, 441-444 
de precios simple, 436-438 

P 

Parametro, 9 

Parametros poblacionales, pruebas para, 349-352 
Patrones, detection de, 483 
Pearson, Karl, 345 
Percentiles, 57-58 
Permutaciones, 93-94 
Planes de muestreo multiple, 545 
Planes de muestreo secuencial, 545 
Planes de muestreo, 545 
Plano de regresion, 378 
Poblacidn, 146; ver tambien , Media 
definition, 8-9 
desviacion estandar, 48-50 
varianza, 48-50 

Poblaciones con varianzas desiguales, grados de 
libertad para, 236-237 

Poblaciones normales 

comparacion de la varianza de dos, 253-255 
Poisson, Simeon, 115 

Premio Nacional de Calidad Malcolm Baldrige, 522- 
523 

Probabilidad condicional, 84-85, 91 
Probabilidad de exito, 109 
Probabilidad de fracaso, 109 
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Probabilidad, 76-77 

condicional, 84-85 
modelo clasico, 78-79 
modelo de frecuencia relativa, 77-78 
modelo subjetivo, 78 
regia de la adicion para, 87-89 
regia de la multiplicacion para, 86 
Probabilidades conjuntas, 83 
Probabilidades marginales, 83 
Proceso de Bernoulli, 108 
Producto intemo bruto (PIB), 447 
Producto intemo bruto real (PIBR), 447 
Profundidades, 29 

Promedio de position (posicional); ver Mediana 
Promedio, 41 

Promedios moviles (PM), 417-420 
Proportion poblacional, 180-181 
pruebas para, 216-218 
(pmeba) Z, 216-218 
Prueba Durbin- Watson, 339 
Pmeba de efectos principales, 299 
Pmeba de hipotesis 

concepto de la, 199-201 
pasos de una, 202 
probabilidad de error en una, 201 
zonas de rechazo en una, 200-201 
Pmeba de Kmskal- Wallis, 496-499 
Pmeba del signo, 477-481, 499 
Pmeba U de Mann- Whitney, 486-490, 499 
Pmeba U, ver Pmeba U de Mann- Whitney 
Pmebas con dos poblaciones 

muestras independientes, 231-237 
muestras pareadas, 231, 238-242 
Pmebas con muestras pequenas, media y, 213-215 
Pmebas de dos colas, 202-203 
U de Mann- Whitney, 489 
valor p para, 210-211 
Pmebas de hipotesis 

con datos pareados, 250-251 


para diferencia de proporciones, 251-252 
para dos medias con muestras independientes 
con muestras grandes, 246-248 
estimation con muestras pequenas, 249- 
250 

Pmebas de rachas, 482-486, 499 
Pmebas de una cola 

para miu (p), 206-209 
pmeba U de Mann- Whitney, 489-490 
Pruebas libres de distribucion; ver pruebas no 
parametricas 

Pmebas no parametricas, 464-465 

comparacion con las pmebas parametricas, 
499 

correlation de rangos de Spearman, 491-495 
distribucion chi-cuadrado, 465-477 
Kmskal-Wallis, 496-499 
pmebas del signo, 477-481 
pmebas de rachas, 482-486 
U de Mann- Whitney, 486-490 
Pmebas parametricas, 464 

comparadas con las pmebas no parametricas, 
499 

Pareto, Vilfredo, 7 


R 

Racha, 482 
Rango, 48 

Razon de normalization, 430 
Razon F, 253; 

tal y como se usa en analisis de varianza, 276 
Razon media por promedio movil, 430 
Razon por promedio movil, 429 
Recta del mejor ajuste, 330 
Redaction de informes, 561-567 
Regia de adicion de la probabilidad, 87-89 
Regia de decision, 201 

Regia de la multiplicacion de la probabilidad, 86 
Regia empirica, 60-61, 123-125, 171, 343 
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Regia, 80/20, 8 
Reglas de probabilidad 
adicion, 87-89 
multiplication, 86 

Regresion bivariada; ver regresion simple 
Regresion curvilineal 
definicion, 325-326 
modelos logarftmicos, 403-404 
modelos polinomicos, 401-402 
Regresion lineal 

definicion, 325-326 
determinacion del modelo, 326-328 
error estandar de estimacion, 341-344 

modelo de minimos cuadrados ordinarios 
(MCO), 328-331 

supuestos de la, 336-340 
Regresion multiple, 325 

coeficiente de determinacion corregido, 382 

coeficiente de determinacion multiple, 381- 
382 

error estandar de estimacion, 380 
modelo de, 377-378 
pruebas de signification, 383-387 
Regresion paso a paso, 396 
Regresion simple, 325 
Relaciones estocasticas, 327 
Relaciones determimsticas, 327 
Restriction, 51 
Resultado, 77 
Resumen ejecutivo, 562 
Riesgo del consumidor, 544 
Riesgo del productor, 543-544 

S 

Serie ordenada, 21, 29 
Series de tiempo 

analisis de tendencia, 424-427 
componentes, 413-416 


descomposicion de 

aislamiento de la componente estacional, 
428-434 

aislamiento de la variacion ticlica, 434-435 
variacion irregular, 435-436 
modelos, 416 

tecnicas de suavizamiento, 416-423 
Sesgo de especificacion, 394 
Sesgo en el muestreo, 11, 160 
Sesgo muestral, 11, 160 
Sesgo, 62 

Shewhart, Walter, 523 
Suavizamiento exponencial, 420-423 
Subagrupamiento racional, 524 
Subgrupo, 524 

Suma de cuadrados de los tratamientos, 277 

Suma de cuadrados del bloque de filas (SCBF), 
303-304 

Suma de cuadrados del error (SCE), 277-278 
Suma de cuadrados, 276-278 
Suma de errores al cuadrado, 330 

T 

Tablas de contingencia, 25-26, 477 

para probabilidad de eventos, 83-87 
Tablas de probabilidad, para eventos, 83-84 
Tamano de la muestra 

determinacion apropiada, 183-184 
incremento, 182 
para estimar 7t, 185 
selection apropiada, 245 
Tecnicas de conteo, 93-95 
Tecnicas de suavizamiento 
exponencial, 420-423 
promedios moviles, 417-420 

Tendencia central; ver medidas de la tendencia 
central 

Tendencia secular, 414 
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Teorema de Bayes, 90-92 
Teorema de Chebyshev, 59 
Teorema de limite central, 150-151 
Tratamiento, 272-273, 299 
Tukey, J., 29 

U 

Unidad de hoja, 29 
Unidades experimentales, 273 
Union de eventos, 80-8 1 
Universo; ver Poblacion 

y 

Valor alfa, 173, 174, 200-201, 255 
Valor deZ, 125-126, 171, 200-201 

calculo de los valores de X a partir de un valor 
conocido, 130-132 

Valor esperado E (X), para una distribucion de 
probabilidad, 106 

Valor p 

definicion, 210-211 
pruebas de dos colas y, 211-212 
Valores crfticos de Z y zonas de rechazo, 200-201 
Valores de X 

calculo, a partir de una probabilidad conocida, 
130-132 

Valores desestacionalizados, 43 1 
Valores extremos, 46 
Variable 

aleatoria, 104-105 
continua, 10 
cualitativa, 10 
cuantitativa, 10 
definicion, 9-10 
discreta, 10 

en escala de intervalo, 13 
en escala de razon, 14 


en escala nominal, 12-13 
en escala ordinal, 13 
Variable aleatoria continua, 105 
Variable aleatoria discreta, 105 
Variable aleatoria, 104-105 
continua, 105 
discreta, 105 
Variable continua, 10 
Variable cualitativa, 10 
Variable cuantitativa, 10 
Variable dependiente, 325 
Variable discreta, 10 
Variable independiente, 325 
Variables dummy, 396-400 
Variation aleatoria, 416, 523 
Variacion de causa asignable, 523 
Variacion dentro de la muestra, 275 
Variacion entre muestras, 275 
Variacion estacional, 428-434 
Variacion total, 275-276 
Variacion, 275 

Variaciones ciclicas, 415, 434-435 
Variaciones irregulares, 416, 435-436 
Varianza 

comparacion, de dos poblaciones normales, 
253-254 

de las distribuciones binomiales. 111 
de las medias muestrales, 147-149 
de una distribucion de probabilidad, 106-107 
muestral, 50-52 
poblacional, 48-50 
problemas de la, 49 
Varianza muestral, 277 

para datos agrupados, 55-56 
Venn, John, 80 
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